机器学习类型概述

article/2025/9/24 4:02:06

从不同的视角来看待诸多机器学习算法,有不同的划分。

1、语料视角

根据训练语料对人工参与类别划分或标签标识的需求程度,可将机器学习划分为四种类型: 监督学习、无监督学习、半监督学习、强化学习。

1.1、监督学习 Supervised Learning

在监督学习算法中,提供给算法用于模型训练的数据,其实例的类别或标签是需要人工进行标注的,也即监督二词之所谓。

监督学习算法主要分为两类:分类回归

分类算法通常用于执行分类操作。比如,给一邮件,模型判断该邮件是否是垃圾邮件。

回归算法通常根据数据实例的各种属性值,去预测一个目标数值。比如,给出一辆二手车的一些属性值,比如车龄、里程数、品牌、型号等,模型预测出该二手车所对应的估值交易价格。

常见的监督学习算法如下:

1.2、无监督学习 Unsupervised Learning

在无监督算法中,不需要对训练数据进行类别或标签的标注。

无监督学习主要分为四类:聚类算法、异常点检测算法、可视化及降维算法、关联算法。

聚类算法主要用于对数据实例进行聚合分组。例如,聚类算法可以让我们对网购的消费者进行分类,而不需要人工为算法提供消费者的预定义类型数目。

异常点检测算法主要应用于对异常实例的检测发现。例如,挖掘交易事务流中的异常交易。

可视化及降维算法应用于高维数据的可视化展示、降维优化。例如,我们对二手车价格进行评估时候,其车龄和里程通常是高度正相关的,通过降维算法就可以将这两个特征进行合并,以简化问题的复杂性。特别是当处理大量数据时候,降维算法可以有效节约内存空间、存储空间、计算时间等。

关联算法应用于挖掘实例数据不同属性之间的关联关系。例如,针对网购消费者,通过关联算法可以发现,买了羊蹄和羊肉串的顾客,通常也会买些孜然粉。

1.3、半监督学习 Semisupervised Learning

半监督学习,介于监督学习和无监督学习之间,需要对训练数据的类别和标签,进行部分标注。很多半监督学习是监督学习和无监督学习的组合。

1.4、强化学习 Reinforcement Learning

强化学习,主要基于 “ 行动 + 赏罚 ” 机制。例如走路机器人、DeepMind 的 AlphaGo 等。同上述三种学习机制相比,强化学习是一个明显的另类,单独自居。

   

     

2、训练视角

根据算法是否可以从数据流中进行增量学习,可以将机器学习算法分为批量学习算法、在线学习算法。

2.1、批量学习 Batch Learning

批量学习不支持增量学习。也就是说,如果要进行模型的版本更新,需要将原有训练语料、增量训练语料放在一起,重新训练得一新的模型,来替换旧模型。

比如,批量学习就像铸造铜像一样,现在已有一个较小的铜像,现在想得到一个较大的铜像(版本更新),就需要将较小的铜像、新的铜料,放在一起进行熔化融合,得到一个较大的铜像。

2.2、在线学习 Online Learning

在线学习可以进行增量学习。

比如,在线学习有点像陈年卤煮的卤汁制作一样,经营的过程中,一批批被加入训练的语料类比于盐、胡椒、花椒、桂皮、八角,需要根据业务的需求,增量地加入新语料进行模型更新训练即可,每加入一批次语料,便是一次版本更新。

   

     

3、预测视角

根据模型预测是基于实例数据的直接对比,还是基于实例模式的抽象计算,可以将机器学习算法划分为基于实例学习、基于模型学习。

3.1、基于实例学习 Instance-based Learning

基于实例的学习,通过对比待预测数据、训练数据,两者的相似度,来把更类似于待预测数据的训练数据标签,赋予待预测数据。

比如,西二旗人大多背双肩电脑包,国贸人大多挎个公文包,现在来了一个新人,背双肩电脑包,我们直观地认为他是西二旗人。

3.2、基于模型学习 Model-based Learning

基于模型的学习,不直接对比训练数据、待预测数据。而是基于训练数据,构建一个抽象模型(包括模型选择、模型训练),然后根据该抽象模型的算法偏好,对待预测数据进行分类或标签的设定。

比如,有一堆被标注为狗狗的图片,有一堆被标注为猫猫的图片,现在来了一张新照片,我们不太容易硬编程不同动物之间的差别,也就是说,不太容易直接同已有照片进行硬编程对比。对此,我们通常设计一个简单的卷积神经网络,训练一个二分类模型,来对新照片来进行分类预测。


http://chatgpt.dhexx.cn/article/7RdB8nYI.shtml

相关文章

对偶学习

考虑一个对偶翻译游戏,里面有两个玩家小明和爱丽丝,如下图所示。小明只能讲中文,爱丽丝只会讲英文,他们两个人一起希望能够提高英文到中文的翻译模型f和中文到英文的翻译模型g。给定一个英文的句子x,爱丽丝首先通过f把…

迁移学习简介及用途

迁移学习简介及用途 https://mp.weixin.qq.com/s/5_EYEJUycTtpfbxM_uGwHw --------------------- 本文来自 mishidemudong 的CSDN 博客 深度神经网络,相比于之前的传统机器学习方法,可以看成是一个全新的物种,这背后的原因,最…

十大机器学习算法

初学者应该知道的十大机器学习算法 来源:https://builtin.com/data-science/tour-top-10-algorithms-machine-learning-newbies 机器学习算法被描述为学习一个目标函数 (f),它最好地将输入变量 (X) 映射到输出变量 (Y):Y f(X) 最常见的机器…

贝叶斯学习

目录 贝叶斯学习 ​贝叶斯学习的特点: 朴素贝叶斯方法: 贝叶斯学习 贝叶斯学习就是基于贝叶斯理论(Bayesian Theory)的机器学习方法。 贝叶斯法则 也称为贝叶斯理论(Bayesian Theorem,或Bayesian Rule&a…

深度强化学习

前言 深度强化学习(DRL)已成为人工智能研究的热点之一。它已被广泛应用于端到端控制、机器人控制、推荐系统、自然语言对话系统等各个领域。本文对深度RL算法及其应用进行了分类,并将现有的DRL算法分为基于模型的方法、无模型的方法和先进RL方法进行介绍。 一、无模…

有效学习的6个方法学习方法

今天看了得到 有效学习的6个方法(上) 的一些感想。 1.价值感 这个就是做这件事情的动力,没有动力的话,是不愿意去做这件事的,效果当然也不会很好。做一件事把这做这件事的意义定的越大,越有动力&#xff0…

如何成为有效学习的高手(许岑)——思维导图

总结自许岑精品课《如何成为有效学习的高手》,图片看不清的可以看下面。 最后有彩蛋! 最后有彩蛋! 最后有彩蛋! 定义 高效学习的定义:找到最适合自己的学习手法,在相对短的时间内集中注意力,以…

如何有效的学习

大一时的我,完全就是个彻头彻尾的学渣,挂科、成绩被同学吊打,每天在宿舍浑噩度日。后来靠这个方法,我能做到最长连续学习10个小时,持续了三个月,也不会觉得很累。 如果你跟之前的我一样,学5分钟…

聊一聊我们应该如何有效学习

我之前写过 关于前端学习路线的一些建议(内含自测题)和 聊一聊加班严重时要如何自我提升 两篇文章。文章内容涉及的是学习路线和时间利用,今天我们就聊聊如何做到有效学习。 这里分享一些关于有效学习的经验,希望能对你有些许帮助…

计算机组成原理-单位转换

字节、字、位、比特之间的关系: 1位1比特;1字2字节;1字节8位;1字16位。 在16位的系统中:1字 2字节(byte) 16(bit) 在32位的系统中:1字 4字节(byte)32&…

【计算机组成原理】computer data reputation数值数据表示

Overview: 1.数据表示的目的(略) 2.数值数据的表示 3.非数值数据的表示 4.数值信息的校验(重点) 1.数据表示的目的: 组织数据,方便计算机硬件使用(汇编语言也具有数据类型&…

计算机组成原理:3.7虚拟存储器

3.7虚拟存储器 思维导图 虚拟存储器的基本概念 虚拟存储器将主存或辅存的地址空间统一编址,形成一个庞大的地址空间,用户可以在里面进行自由编址,而不需要在乎实际的主存容量和程序存放的位置 虚拟地址比实际地址大 过程 CPU使用虚地址时…

计算机原理概述

目录 计算机的发展史(稍作了解即可) 从硬件方面来了解计算机 程序的存储 广义数据在内存的存储问题 CPU的基本工作原理 让我们来从以下两个方面来了解计算机: 1.从硬件角度学习计算机的基本原理————CPU的基本工作原理 2.从操作系统…

《计算机组原理》存储器(一)

4.1概述4.1.1存储器的分类4.1.2 存储器的层次结构 4.2主存储器4.2.2半导体存储芯片简介4.2.3 随机存取存储器4.2.4只读存储器4.2.5存储器与CPU的连接4.2.6 存储器的校验4.2.7提高访存速度的措施 4.1概述 4.1.1存储器的分类 4.1.2 存储器的层次结构 一般来说,高速越…

计算机原理(硬件角度—CPU)

​ 一、概述 1、关于计算机原理: (1)从硬件角度学习计算机的基本工作原理——CPU的基本工作原理。 (2)从操作系统软件角度,学习我们的程序是如何工作起来的——进程管理。 2、程序指令数据 程序算法&…

计算机组成原理——数据的表示与运用

数值与编码 进位记数制及其相互转换十进制、二进制、八进制、十六进制真值、机器数(原码、反码、补码)字符与字符串的编码(小端和大端方式存储 )数据校验奇偶校验、CRC冗余校验、海明校验 定点数的表示和运算 无符号数的表示&…

【计算机组成原理】04-计算机的计算单位

一、容量单位 字节:1Byte8bits ◆ 理论上只认识0/1两种状态 ◆ 在物理层面,高低电平记录信息 ◆ 0/1能够表示的内容太少了,需要更大的容量表示方法 1G内存,可以存储多少字节的数据?可以存储多少比特数据?…

计算机组成原理_虚拟存储器

计算机组成原理总目录 虚拟存储器 虚拟存储器主要解决的是用于解决存储数据的容量问题 例如在电脑的辅存磁盘中存放了几百GB甚至几TB的数据,包括几十个上百个程序 但我们在实际运行时,并不需要使用到所有的数据,而只需要用到其中一个或者两个…

计算机原理-数据

数据 二进制 十进制(人类use) 十六进制 (2,4,16 是权) 1011.0112^30*2^22^12^00*2^-11*2^-21*2^-3802100.250.125 27.375 七进制转十进制(权不一样) 604.01 6*7^20*7^14*7^00*7…

(一)计算机组成原理之计算机系统导论(冯诺依曼计算机以及cpu,机器字长,MAR,存储单元,MDR,存储字长等)

❤️ 知识点 1.冯诺依曼计算机的构成:运算器,控制器,存储器,输入设备和输出设备 2.计算机的硬件组成:.原始的冯诺依曼在结构上是以运算器为中心,而发展到现在,以转向以存储器为中心。&#xff…