贝叶斯学习

article/2025/9/24 4:24:16

目录

贝叶斯学习

​贝叶斯学习的特点:

朴素贝叶斯方法:


贝叶斯学习


贝叶斯学习就是基于贝叶斯理论(Bayesian Theory)的机器学习方法。
贝叶斯法则 也称为贝叶斯理论(Bayesian Theorem,或Bayesian Rule,或Bayesian Law),其核心就是贝叶斯公式:


先验概率(Prior Probability) 就是还没有训练数据之前,某个假设h(h∈H)的初始概率,记为P(h)。 先验概率反映了一个背景知识,表示h是一个正确假设的可能性有多少。 如果没有这一先验知识,那么可以简单地将每一候选假设赋予相同的先验概率。
P(d)表示训练数据d的先验概率,也就是在任何假设都未知或不确定时d的概率。
P(d|h)表示已知假设h成立时d的概率,称之为类条件概率,或者给定假设h时数据d的似然度(Likelihood)。

后验概率(Posterior Probability) 就是在数据d上经过学习之后,获得的假设h成立的概率,记为P(h|d)。 P(h|d)表示给定数据d时假设h成立的概率,称为h的后验概率。
后验概率是学习的结果,反映了在看到训练数据d之后,假设h成立的置信度。 后验概率用作解决问题时的依据。 对于给定数据根据该概率做出相应决策,例如判断数据的类别,或得出某种结论,或执行某种行动等等。
P(h|d)随着P(h)和P(d|h)的增长而增长,随着P(d)的增长而减少。 即如果d独立于h时被观察到的可能性越大,那么d对h的支持度越小。 后验概率是对先验概率的修正。
后验概率P(h|d)是在数据d上得到的学习结果,反映了数据d的影响,这个学习结果是与训练数据相关的。 与此相反,先验概率是与训练数据d无关的,是独立于d的

贝叶斯法则解决的机器学习任务一般是在给定训练数据D时,确定假设空间H中的最优假设。这是典型的分类问题。 贝叶斯法则基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身,提供了一种计算假设概率的方法。
分类问题的最优假设(即最优结果),可以有不同定义。 例如,与期望误差最小的假设;或者能取得最小熵(Entropy)的假设等等。 贝叶斯分类器是指为在给定数据d、假设空间H中不同假设的先验概率以及有关知识下的最可能假设。 这个最可能假设可有不同选择。

(1)极大后验假设     (Maximum A Posteriori,简称MAP假设)   极大后验假设hMAP ( hMAP  ∈H)就是在候选假设集合H中寻找对于给定数据d使后验概率P(h|d)最大的那个假设。

(2)极大似然假设     (Maximum Likelihood,简称ML假设)  极大似然假设就是在候选假设集合H中选择使给定数据d似然度(即类条件概率)P(d|h)最大的假设,即ML假设  (hML  ∈H)是满足下式的假设。

极大似然假设和极大后验假设有很强的关联性。 由于数据似然度是先验知识,不需要训练就能知道。所以在机器学习实践中经常应用极大似然假设来指导学习。

(3)贝叶斯最优分类器     (Bayes Optimal Classifier) 贝叶斯最优分类器是对最大后验假设的发展。它并不是简单地直接选取后验概率最大的假设(模型)作为分类依据。 而是对所有假设(模型)的后验概率做线性组合(加权求和),然后再选择加权和最大结果作为最优分类结果
设V表示类别集合,对于V中的任意一个类别vj,概率P(vj|d)表示把数据d归为类别vj的概率。 贝叶斯最优分类就是使P(vj|d)最大的那个类别。贝叶斯最优分类器就是满足下式的分类系统。

在相同的假设空间和相同的先验概率条件下,其它方法的平均性能不会比贝叶斯最优分类器更好。 虽然贝叶斯最优分类器能从给定训练数据中获得最好性能,但是其算法开销比较大。

示例:



1.MAP

2.贝叶斯最优分类器



贝叶斯学习的特点:

贝叶斯学习为衡量多个假设的置信度提供了定量的方法,可以计算每个假设的显式概率,提供了一个客观的选择标准。

特性
观察到的每个训练样例可以增量地降低或升高某假设的估计概率。
先验知识可以与观察数据一起决定假设的最终概率。
允许假设做出不确定性的预测。例如前方目标是骆驼的可能性是90%,是马的可能性是5%。
新的实例分类可由多个假设一起做出预测,用它们的概率来加权。
即使在贝叶斯方法计算复杂度较高时,它仍可作为一个最优决策标准去衡量其它方法。

朴素贝叶斯方法:

在机器学习中一个实例x往往有很多属性 <a1,a2,…,an> 其中每一维代表一个属性,该分量的数值就是所对应属性的值。
此时依据MAP假设的贝叶斯学习就是对一个数据<a1,a2,…,an>,求使其满足下式的目标值。其中H是目标值集合。 

估计每个P(hi)很容易,只要计算每个目标值hi出现在训练数据中的频率就可以。 如果要如此估计所有的P(a1,a2,…,an|hi)项,则必须计算a1,a2,…,an的所有可能取值组合,再乘以可能的目标值数量
假设一个实例有10个属性,每个属性有3个可能取值,而目标集合中有5个候选目标(5个实例)。那么P(a1,a2,…,an|hi)项就有 个。不适合于高维数据!

对于贝叶斯学习有两种思路可以解决高维数据问题。一种是朴素贝叶斯(Naïve Bayes)方法,也称为简单贝叶斯(Simple Bayes)方法。
朴素贝叶斯分类器采用最简单的假设: 对于目标值,数据各属性之间相互条件独立。 即,a1,a2,…,an的联合概率等于每个单独属性的概率乘积:

将上页的式子带入上面求  hMAP  的公式中,就得到朴素贝叶斯分类器所用的方法:

仍假设一个实例有10个属性,每个属性有3个可能取值,而目标集合中有5个候选目标。朴素贝叶斯分类器中需要从训练数据中估计的P(aj|hi)项的数量是 5*3*10  

朴素贝叶斯学习的主要过程在于计算训练样例中不同数据组合的出现频率,统计出P(hi)和P(aj|hi)。 算法比较简单,是一种很有效的机器学习方法。
当各属性条件独立性满足时,朴素贝叶斯分类结果等于MAP分类。 这一假定一定程度上限制了朴素贝叶斯方法的适用范围。 但是在实际应用中,许多领域在违背这种假定的条件下,朴素贝叶斯学习也表现出相当的健壮性和高效性。


 


http://chatgpt.dhexx.cn/article/P1iuVFJJ.shtml

相关文章

深度强化学习

前言 深度强化学习(DRL)已成为人工智能研究的热点之一。它已被广泛应用于端到端控制、机器人控制、推荐系统、自然语言对话系统等各个领域。本文对深度RL算法及其应用进行了分类&#xff0c;并将现有的DRL算法分为基于模型的方法、无模型的方法和先进RL方法进行介绍。 一、无模…

有效学习的6个方法学习方法

今天看了得到 有效学习的6个方法&#xff08;上&#xff09; 的一些感想。 1.价值感 这个就是做这件事情的动力&#xff0c;没有动力的话&#xff0c;是不愿意去做这件事的&#xff0c;效果当然也不会很好。做一件事把这做这件事的意义定的越大&#xff0c;越有动力&#xff0…

如何成为有效学习的高手(许岑)——思维导图

总结自许岑精品课《如何成为有效学习的高手》&#xff0c;图片看不清的可以看下面。 最后有彩蛋&#xff01; 最后有彩蛋&#xff01; 最后有彩蛋&#xff01; 定义 高效学习的定义&#xff1a;找到最适合自己的学习手法&#xff0c;在相对短的时间内集中注意力&#xff0c;以…

如何有效的学习

大一时的我&#xff0c;完全就是个彻头彻尾的学渣&#xff0c;挂科、成绩被同学吊打&#xff0c;每天在宿舍浑噩度日。后来靠这个方法&#xff0c;我能做到最长连续学习10个小时&#xff0c;持续了三个月&#xff0c;也不会觉得很累。 如果你跟之前的我一样&#xff0c;学5分钟…

聊一聊我们应该如何有效学习

我之前写过 关于前端学习路线的一些建议&#xff08;内含自测题&#xff09;和 聊一聊加班严重时要如何自我提升 两篇文章。文章内容涉及的是学习路线和时间利用&#xff0c;今天我们就聊聊如何做到有效学习。 这里分享一些关于有效学习的经验&#xff0c;希望能对你有些许帮助…

计算机组成原理-单位转换

字节、字、位、比特之间的关系&#xff1a; 1位1比特&#xff1b;1字2字节&#xff1b;1字节8位&#xff1b;1字16位。 在16位的系统中:1字 2字节&#xff08;byte&#xff09; 16&#xff08;bit&#xff09; 在32位的系统中:1字 4字节&#xff08;byte&#xff09;32&…

【计算机组成原理】computer data reputation数值数据表示

Overview&#xff1a; 1.数据表示的目的&#xff08;略&#xff09; 2.数值数据的表示 3.非数值数据的表示 4.数值信息的校验&#xff08;重点&#xff09; 1.数据表示的目的&#xff1a; 组织数据&#xff0c;方便计算机硬件使用&#xff08;汇编语言也具有数据类型&…

计算机组成原理:3.7虚拟存储器

3.7虚拟存储器 思维导图 虚拟存储器的基本概念 虚拟存储器将主存或辅存的地址空间统一编址&#xff0c;形成一个庞大的地址空间&#xff0c;用户可以在里面进行自由编址&#xff0c;而不需要在乎实际的主存容量和程序存放的位置 虚拟地址比实际地址大 过程 CPU使用虚地址时…

计算机原理概述

目录 计算机的发展史&#xff08;稍作了解即可&#xff09; 从硬件方面来了解计算机 程序的存储 广义数据在内存的存储问题 CPU的基本工作原理 让我们来从以下两个方面来了解计算机&#xff1a; 1.从硬件角度学习计算机的基本原理————CPU的基本工作原理 2.从操作系统…

《计算机组原理》存储器(一)

4.1概述4.1.1存储器的分类4.1.2 存储器的层次结构 4.2主存储器4.2.2半导体存储芯片简介4.2.3 随机存取存储器4.2.4只读存储器4.2.5存储器与CPU的连接4.2.6 存储器的校验4.2.7提高访存速度的措施 4.1概述 4.1.1存储器的分类 4.1.2 存储器的层次结构 一般来说&#xff0c;高速越…

计算机原理(硬件角度—CPU)

​ 一、概述 1、关于计算机原理&#xff1a; &#xff08;1&#xff09;从硬件角度学习计算机的基本工作原理——CPU的基本工作原理。 &#xff08;2&#xff09;从操作系统软件角度&#xff0c;学习我们的程序是如何工作起来的——进程管理。 2、程序指令数据 程序算法&…

计算机组成原理——数据的表示与运用

数值与编码 进位记数制及其相互转换十进制、二进制、八进制、十六进制真值、机器数&#xff08;原码、反码、补码&#xff09;字符与字符串的编码&#xff08;小端和大端方式存储 &#xff09;数据校验奇偶校验、CRC冗余校验、海明校验 定点数的表示和运算 无符号数的表示&…

【计算机组成原理】04-计算机的计算单位

一、容量单位 字节&#xff1a;1Byte8bits ◆ 理论上只认识0/1两种状态 ◆ 在物理层面&#xff0c;高低电平记录信息 ◆ 0/1能够表示的内容太少了&#xff0c;需要更大的容量表示方法 1G内存&#xff0c;可以存储多少字节的数据&#xff1f;可以存储多少比特数据&#xff1f;…

计算机组成原理_虚拟存储器

计算机组成原理总目录 虚拟存储器 虚拟存储器主要解决的是用于解决存储数据的容量问题 例如在电脑的辅存磁盘中存放了几百GB甚至几TB的数据&#xff0c;包括几十个上百个程序 但我们在实际运行时&#xff0c;并不需要使用到所有的数据&#xff0c;而只需要用到其中一个或者两个…

计算机原理-数据

数据 二进制 十进制&#xff08;人类use&#xff09; 十六进制 &#xff08;2&#xff0c;4&#xff0c;16 是权&#xff09; 1011.0112^30*2^22^12^00*2^-11*2^-21*2^-3802100.250.125 27.375 七进制转十进制&#xff08;权不一样&#xff09; 604.01 6*7^20*7^14*7^00*7…

(一)计算机组成原理之计算机系统导论(冯诺依曼计算机以及cpu,机器字长,MAR,存储单元,MDR,存储字长等)

❤️ 知识点 1.冯诺依曼计算机的构成&#xff1a;运算器&#xff0c;控制器&#xff0c;存储器&#xff0c;输入设备和输出设备 2.计算机的硬件组成&#xff1a;.原始的冯诺依曼在结构上是以运算器为中心&#xff0c;而发展到现在&#xff0c;以转向以存储器为中心。&#xff…

计算机组成原理:如何衡量计算机的性能

在计算机组成原理乃至体系结构中&#xff0c;“性能”都是最重要的一个主题。学习和研究计算机组成原理&#xff0c;就是在理解计算机是怎么运作的&#xff0c;以及为什么要这么运作。“为什么”所要究竟的事情&#xff0c;很多时候就是提升“性能” 什么是性能&#xff1f;时…

计算机组成原理 --- 计算机性能指标

一.存储器的性能指标 1.MAR是地址寄存器&#xff0c;MDR是数据寄存器 2.MAR的位数能够体现最多存多少个地址&#xff0c;而每个地址就代表一个存储单元&#xff0c;所以MAR的位数能表示存储器中有多少个存储单元 3.MDR是数据寄存器&#xff0c;它的容纳极限 每个存储单元的…

通用计算机器

还是下面这句话&#xff1a; 将固定的资源在所有使用者中分配&#xff0c;而不是为每一个使用者分配固定额度的资源。 还是那个简单的倒换&#xff0c;通用计算机就设计出来了。 人们就意识到内存和CPU之间的总线成了瓶颈&#xff0c;于是人们拼命缩短这条总线的长度&#xff…

量子计算机是什么?量子计算机和传统计算机之间有什么区别?

1.突破1000量子比特大关&#xff01; 2022年11月9日的IBM年度量子峰会上&#xff0c;IBM宣布了Osprey在量子硬件和软件方面取得的突破性进展&#xff0c;同时推出了“鱼鹰”&#xff08;Osprey&#xff09;芯片。“鱼鹰”是全球迄今为止量子比特最多的量子计算机&#xff0c;而…