有监督和无监督

article/2025/9/17 6:29:33

来自有监督vs.无监督,傻傻分不清楚? - 搜狐网

网上对于有监督和无监督差异性的文章非常多,本文将重点从应用的角度来阐述如何选择有监督和无监督。

对比一:有标签 vs. 无标签

有监督又被称为“有老师的学习”,无监督被称为“没有老师的学习”,所谓的老师就是标签。有监督的过程为先通过已知的训练样本(已知输入和对应的输出)来训练,从而得到一个最优模型,再将这个模型应用在新的数据上,映射为输出结果。经历这个过程后,模型具有了预知能力。无监督相比于有监督,没有训练的过程,而是直接拿数据进行建模分析,也就是没有老师告诉你对错,全靠自己探索。这听起来似乎有点不可思议,但是在我们自身认识世界的过程中也会用到无监督学习。比如我们去参观一个画展,我们对艺术一无所知,但是欣赏完多幅作品之后,我们也能把它们分成不同的派别(比如哪些更朦胧一点,哪些更写实一些。即使我们不知道什么叫做朦胧派和写实派,但是至少我们能把他们分为两个类)。

对比二:分类 vs. 聚类

有监督的核心是分类,无监督的核心是聚类(将数据集合分成由类似的对象组成的多个类)。有监督的工作是选择分类器和确定权值,无监督的工作是密度估计(寻找描述数据统计值),也就是无监督算法只要知道如何计算相似度就可以开始工作了。

对比三:同维vs.降维

有监督的输入如果是n维,特征即被认定为n维,也即y=f(xi)或p(y|xi), i =n,通常不具有降维的能力。而无监督经常要参与深度学习,做特征提取,或者干脆采用层聚类或者项聚类,以减少数据特征的维度,使i<n。事实上,无监督学习常常被用于数据预处理。一般而言,这意味着以某种平均-保留的方式压缩数据,比如主成分分析(PCA)或奇异值分解(SVD),之后,这些数据可被用于深度神经网络或其它监督式学习算法。

对比四:分类同时定性 vs. 先聚类后定性

有监督的输出结果,也就是分好类的结果会被直接贴上标签,是好还是坏。也即分类分好了,标签也同时贴好了。类似于中药铺的药匣,药剂师采购回来一批药材,需要做的只是把对应的每一颗药材放进贴着标签的药匣中。

图1 把每一颗药材放进贴好标签的药匣

无监督的结果只是一群一群的聚类,就像被混在一起的多种中药,一个外行要处理这堆药材,能做的只有把看上去一样的药材挑出来聚成很多个小堆。如果要进一步识别这些小堆,就需要一个老中医(类比老师)的指导了。因此,无监督属于先聚类后定性,有点类似于批处理。

图2 聚好类的药材,待贴标签

对比五:独立和非独立

李航在其著作《统计学习方法》(清华大学出版社)中阐述了一个观点:对于不同的场景,正负样本的分布可能会存在偏移(可能是大的偏移,也可能偏移比较小)。怎么理解呢?假设我们手动对数据做标注作为训练样本,并把样本画在特征空间中,发现线性非常好,然而在分类面,总有一些混淆的数据样本。对这种现象的一个解释是,不管训练样本(有监督),还是待分类的数据(无监督),并不是所有数据都是相互独立分布的。或者说,数据和数据的分布之间存在联系。作为训练样本,大的偏移很可能会给分类器带来很大的噪声,而对于无监督,情况就会好很多。也就是,独立分布数据更适合有监督,非独立数据更适合无监督。

对比六:不透明和可解释性

由于有监督算法最后输出的一个结果,或者说标签。yes or no,一定是会有一个倾向。但是,如果你想探究为什么这样,有监督会告诉你:因为我们给每个字段乘以了一个参数列[w1, w2, w3...wn]。你继续追问:为什么是这个参数列?为什么第一个字段乘以了0.01而不是0.02?有监督会告诉你:这是我自己学习计算的呀!然后,就拒绝再回答你的任何问题。是的,有监督算法的分类原因是不具有可解释性的,或者说,是不透明的,所以,对于像反洗钱这种需要明确规则的场景,就很难应用。而无监督的聚类方式通常是有很好的解释性的,你问无监督,为什么把他们分成一类?无监督会告诉你,他们一二三四条特征有多少的一致性,所以才被聚成一组。你恍然大悟,原来如此!于是,进一步可以将这个特征组总结成规则。如此这般分析,聚类原因便昭然若揭了。

对比七:DataVisor无监督独有的扩展性

试想这样一个n维模型,产出结果已经非常好,这时又增加了一维数据,变成了n+1维。那么,如果这是一个非常强的特征,足以将原来的分类或者聚类打散,一切可能需要从头再来,尤其是有监督,权重值几乎会全部改变。而DataVisor开发的无监督算法,具有极强的扩展性,无论多加的这一维数据的权重有多高,都不影响原来的结果输出,原来的成果仍然可以保留,只需要对多增加的这一维数据做一次处理即可。

如何选择有监督和无监督?

了解以上对比后,我们在做数据分析时,就可以高效地做选择了。

图3 有/无监督选择方法

首先,我们看是否有训练数据,也即是否有标签。没有标签的直接选择无监督。事实上,对数据了解得越充分,模型的建立就会越准确,学习需要的时间就会越短。我们主要应该了解数据的以下特性: 特征值是离散型变量还是连续型变量,特征值中是否存在缺失的值,何种原因造成缺失值,数据中是否存在异常值,某个特征发生的频率如何 (是否罕见得如同大海捞针)。

其次,数据条件是否可改善?在实际应用中,有些时候即使我们没有现成的训练样本,我们也能够凭借自己的双眼,从待分类的数据中人工标注一些样本,这样就可以把条件改善,从而用于有监督学习。当然不得不说,有些数据的表达会非常隐蔽,也就是我们手头的信息不是抽象的形式,而是具体的一大堆数字,这样我们很难人工对它们进行分类。举个例子,在bag - of - words 模型中,我们采用k-means算法进行聚类,从而对数据投影。在这种情况下,我们之所以采用k-means,就是因为我们只有一大堆数据,而且是很高维的,若想通过人工把他们分成50类是十分困难的。想象一下,一个熊孩子把你珍藏的50个1000块的拼图混在了一起,你还用勇气再把这50000个凌乱的小方块区分开吗?所以说遇到这种情况也只能选用无监督学习了。

最后,看样本是否独立分布。对于有训练样本的情况,看起来采用有监督总是比采用无监督好。单纯想一想,有人指导总比自己探索好吧,即使是学习优异的学生,也非常抵触老师把练习题的答案撕掉,对吧?做完题对一下答案,总觉得会更安心一点。但对于非独立分布的数据,由于其数据可能存在内在的未知联系,因而存在某些偏移量,采用无监督就显得更合适了


http://chatgpt.dhexx.cn/article/j5XmTAQN.shtml

相关文章

机器学习:有监督和无监督之间有什么区别

机器学习是人工智能的一个子集&#xff0c;它通过示例和经验教会计算机执行任务&#xff0c;是研究和开发的热门领域。我们每天使用的许多应用程序都使用机器学习算法&#xff0c;包括AI助手&#xff0c;Web搜索和机器翻译。 您的社交媒体新闻提要由机器学习算法提供支持。您、…

有监督学习与无监督学习的几大区别

当下无监督作为一种热门的机器学习技术&#xff0c;网上有不少关于无监督与有监督差异讨论的文章。DataVisor作为率先将无监督技术运用在反欺诈行业的娇娇领先者&#xff0c;我们在本文中&#xff0c;将深入浅出的讲解无监督机器学习技术与有监督技术在不同方面的区别&#xff…

监督学习和无监督学习区别

前言 机器学习分为&#xff1a;监督学习&#xff0c;无监督学习&#xff0c;半监督学习&#xff08;也可以用hinton所说的强化学习&#xff09;等。 在这里&#xff0c;主要理解一下监督学习和无监督学习。 监督学习&#xff08;supervised learning&#xff09; 从给定的训…

关于使用burpsuite时,“安全连接失败,使用了无效的证书”问题【已解决】

安装好burpsuite&#xff0c;配置好网络连接代理后&#xff0c;导入了证书&#xff0c;访问某一网站还是会出现如下现象&#xff1a; 解决方案&#xff1a; 打开浏览器设置-高级-证书-证书机构&#xff0c;删除刚才导入的证书。 再次访问http:\burp下载证书。 再次在设置-高级…

火狐浏览器出现“建立安全连接失败”PR_CONNECT_RESET_ERROR解决方法

访问一个网站出现这样的问题&#xff0c;可能是因为自己设置一些东西导致DNS解析出错。 我找了网上几个比较主流的方法都不能解决&#xff0c;最后就是一招刷新DNS解决了。&#xff08;哭笑不得&#xff09; 解决方法&#xff1a; 按“win R”键&#xff0c;启动运行窗口&a…

Horizon client连接错面报错:无法建立安全加密链路连接

一、问题描述 前方人员反馈在Horizon环境中交付桌面前&#xff0c;验证过程中&#xff0c;使用Horizon client登录错误报&#xff1a;无法建立安全加密链路连接&#xff0c;如下图所示&#xff1a; UAG软件版本&#xff1a;3.9 二、分析处理 1、检查客户端SSL配置选项&…

华为设备web登录,安全连接失败问题解决办法

web登录华为交换机、路由器失败 详细错误信息如下&#xff1a; 解决办法 1、可以更换浏览器解决 2、火狐浏览器可以通过加载插件解决&#xff0c;插件链接点击打开链接 3、如果上面链接有问题按如下方法安装插件&#xff1a;1&#xff09;附件组件-扩展-搜索Disable DHE 安…

selenium自动化学习--解决firefox无法建立安全连接的问题(TLS1.0/TLS1.1)

解决Firefoxselenium无法建立安全连接的问题SSL_ERROR_UNSUPPORTED_VERSION 问题&#xff1a;解决方案&#xff1a; 问题&#xff1a; 在使用pythonselenium做firefox浏览器自动化测试的时候&#xff0c;遇到了如下问题&#xff1a; 代码如下&#xff1a; profile webdriver.…

Win11此站点的连接不安全解决教程

Win11此站点的连接不安全怎么解决&#xff1f;导致出现这一情况的原因很有可能是是因为网络证书不匹配引起的&#xff0c;对此今天小编就为大家带来Win11此站点的连接不安全解决方法介绍&#xff0c;步骤简单&#xff0c;安全有效&#xff0c;我们一起来看看吧。 解决方法&…

Tomcat启用SSL导致Firefox出现“安全连接失败”错误的解决方法

今天升级了Firefox&#xff0c;发现之前一个可以访问的网站被拦截&#xff0c;提示“连接10.0.0.5时发生错误。在服务器密钥交换握手信息中SSL收到了一 个弱临时Diffie-Hellman密钥。&#xff08;错误码&#xff1a;ssl_error_weak_server_ephemeral_dh_key&#xff09;&#x…

用浏览器访问防火墙提示建立连接失败的有点总结

1.问题起始&#xff1a; 通过火狐浏览器远程访问一台华为USG5000防火墙时&#xff0c;提示我建立安全连接失败。已经判断网络正常&#xff0c;尝试使用其他浏览器&#xff0c;提示都是对端使用了不支持的安全协议。 2.问题解决&#xff08;已火狐浏览器为例&#xff09;&#…

当遇到火狐浏览器“建立安全连接失败”问题,处理方法

报错内容大概为&#xff1a;连接到某一网站时&#xff0c;发生错误&#xff0c;在服务器密钥交换握手信息中SSL收到了一个弱临时Diffie-Hellman密钥。错误代码&#xff1a;SSL_ERROR_WEAK_SERVER_EPHEMERAL_DH_KEY&#xff0c;如图 原因1&#xff1a;缺少Disable-DHE组件导致&a…

建立安全连接失败连接到 120.79.9.99:9200 时发生错误。SSL 接收到一个超出最大准许长度的记录。错误代码:SSL_ERROR_RX_RECORD_TOO_LONG

建立安全连接失败 连接到 120.79.9.99:9200 时发生错误。SSL 接收到一个超出最大准许长度的记录。 错误代码&#xff1a;SSL_ERROR_RX_RECORD_TOO_LONG 因为我是用https访问的需要安全协议只要改为http就行啦 或者直接IP加端口号就行了。主要是自己粗心没有注意。

火狐浏览器打开GitHUb时,说“建立安全连接失败”,解决方案

火狐浏览器打开GitHUb时&#xff0c;说“建立安全连接失败”&#xff0c;解决方案 &#xff08;刚找到&#xff0c;在这记录一下&#xff09; 如图 &#xff08;忽略图中网站&#xff09;打开GItHUb时会出现这样的情况 解决方法 crtlf5就可以了&#xff0c;简单粗暴。

通过bocker把项目部署到容器后,也启动了镜像,但是浏览器报错网址连接不安全,建立安全连接失败,SSL接收到了一个超出最大准许长度的记录

解决方案&#xff1a; 把输入的网址头的https的 ‘s’ 去掉&#xff0c;换成http就可以了 编码不易 如有帮助到您 请支持一下 多谢

火狐浏览器,访问腾讯云服务器的时候,出现建立安全连接失败的问题。

在腾讯云上部署了一个服务器&#xff0c;听过服务器ip访问项目的时候&#xff0c;刚开始的时候&#xff0c;启动tomcat&#xff0c;是可以启动的&#xff0c;有进程的&#xff0c;但是访问的时候&#xff0c;会出现超时连接。后来想了想可能是端口的问题。在服务器上&#xff0…

建立安全连接失败_安全失败

建立安全连接失败 上周&#xff0c;我参加了有关可伸缩敏捷框架SAFe的演示 。 我之前已经阅读过有关它的内容&#xff0c;但这是对该主题的更广泛的介绍。 这将是成功的。 当我谈论scrum为什么成功地跨越了开发人员世界到业务世界的鸿沟时&#xff0c;我看到的主要原因是它抛…

建立安全连接失败(解决浏览器提示建立安全连接失败问题)

解决浏览器提示建立安全连接失败问题分享 1、首先打开开始菜单,选择“网络和Internet”并进入。 2、接着在“以太网”选项中选择“更改适配器选项”,点击并进入。

浏览器建立安全连接失败

使用firefox浏览器突然出现以下错误&#xff1a; 点击详细了解并没有解决问题&#xff08;下图是官方给的可能的原因&#xff09; 我尝试的解决办法&#xff1a; 换网 &#xff08;无用&#xff09;换浏览器&#xff08;无用&#xff09;关掉自己的VPN一段时间&#xff0c;关…