贝叶斯决策论(一):贝叶斯决策理论

article/2025/11/9 16:25:57

贝叶斯决策论是利用概率的不同分类决策与相应的决策代价之间的平衡,核心思想是决策问题可以通过概率的形式来描述。

目录

1 Notation

2 贝叶斯分类

3 贝叶斯决策理论

3.1 最小误差概率决策

 3.2 连续特征下的最小化风险决策

 3.2.1 0-1损失函数下的风险函数

3.2.2 两类分类问题

 4 分类器、判别函数与判决区域


1 Notation

了解贝叶斯决策论之前先学习有关的符号:

假定x是一个连续随机变量,其分布取决于类别状态,表示为 p(x|\omega ) 的形式,这就是类条件概率密度,即类别状态为 \omega 时的x的概率密度函数。通俗的理解:分类作为概率密度函数的条件。

2 贝叶斯分类

        假设我们要对一种物体进行分类,只根据它的先验概率p(w)分类是不现实的,若某种类型的先验概率较大,那么几乎所有物体都会被判别为那种类型,这显然是错误的。

        为了更好的进行分类,我们观察事物的一些特征X,例如对于鱼分类——鱼的光泽程度,对西瓜分类——西瓜的颜色。统计了关于特征x的类条件概率密度。根据贝叶斯公式:

P(\omega_j|x)=\frac{p(x|\omega_j)P(\omega _j)}{p(x)}表明,通过观测x的值我们可以将先验概率P(\omega_j)转换为后验概率P(\omega_j|x),即假设特征值x已知的条件下类别为wj的概率。

上图是一个二分类问题,可以看到右图中每个横坐标下对应的后验概率之和为1。

我们可以初步的利用后验概率进行分类。

3 贝叶斯决策理论

3.1 最小误差概率决策

        根据第2节的内容,如果有某个观测值x使得 P(\omega_1|x)>P(\omega_2|x) 我们自然的会做出真实类别是w1的判断,我们计算做出某次分类判决时的误差概率:

P(error|x)=1-P(\omega_i|x):choose-\omega_i

        对于特殊的二分类问题,我们有:

        可验证得到,这种规则可以将平均误差概率最小化。因此,我们得到了最小化误差概率条件下的贝叶斯决策规则:对于二分类问题        

if\ p(\omega_1|x)>p(\omega_2|x),\ choose\ \omega_1;otherwise\ choose\ \omega_2

        注意到在贝叶斯公式中,分母证据因子p(x)对于做出某种决策并不重要,表示我们实际测量的具有特征x的模式的出现概率,实际问题中可以忽略。

 3.2 连续特征下的最小化风险决策

对于3.1所讨论的问题我们推广到以下四种情况:

  • 有多于一个特征x
  • 多种类别状态\omega_i
  • 允许有其他的行为而不仅仅是判别类型
  • 引入一个更一般损失函数来代替误差概率p(error)

        计算后验概率的贝叶斯公式将一维的特征x推广到多维x向量:P(\omega_j|\textbf{x})=\frac{p(\textbf{x}|\omega_j)P(\omega _j)}{p(x)} (证据因子 p(\textbf{x})=\sum_{j=1}^{c}p(\textbf{x}|\omega_j)p(\omega_j) )

        假定我们观测某个特定模式x并且采取行动 \alpha_i ,如果真实的类别状态为 \omega_j ,通过定义我们将有损失 \lambda(a_i|\omega_j) 。既然 p(\omega_j|x) 是实际类别状态为 \omega_j 时的概率,与行为 \alpha_i 相关联的损失——条件风险

R(\alpha_i|x)=\sum_{j=1}^c\lambda (\alpha_i|\omega_j)P(\omega_j|\textbf{x})

        回到最初的问题,我们希望找到一种替代 P(\omega_i) 的决策规则以最小化总风险,我们设\alpha(x)观测某个特征的向量形式x而采取的行动,总风险R:

R=\int R(\alpha(\textbf{x})|\textbf{x})p(\textbf{x})d\textbf{x}——此积分是在整个特征空间进行的

        因此我们得出最小化风险决策的贝叶斯决策规则:为了最小化总风险,对所有的 i = 1,2...,a 计算条件风险:R(\alpha_i|x)=\sum_{j=1}^c\lambda (\alpha_i|\omega_j)P(\omega_j|\textbf{x}) 并且选择 \alpha_i 使  R(\alpha_i|x) 最小化。最小化后的总风险记为R*,叫做贝叶斯风险,他是可获得的最优结果。

        可以看下图的例子,分别每种行动的总风险计算得出:在某人前往高风险地区时应该采取的决策是做核酸

 3.2.1 0-1损失函数下的风险函数

        假设采取行为为\alpha_i而实际类别为\omega_j,那么在i=j的情况下判决时正确的,如果i != j 则定义为误判,当我们采用0-1损失函数/对称损失函数:

\lambda(\alpha_i|\omega_j)=\left\{\begin{matrix} 0 & i=j\\ 1 & i\neq j \end{matrix}\right.

        这个损失函数将0损失赋给一个正确的判断,而将一个单位损失赋给任何一个错误判决,所有误判代价都是等价的,这种情况下的条件风险为:

R(\alpha_i|\textbf{x})=\sum_{j=1}^c\lambda(\alpha_i|\omega_j)P(\omega_j|\textbf{x})=\sum_{j\neq i}P(\omega_j|\textbf{x})=1-P(\omega_i|\textbf{x})

        这种情况下我们想最小化风险只要选取i使得后验概率最大即可。

3.2.2 两类分类问题

        考虑将最小化风险决策运用到两类分类问题时,简化以\lambda_{ij}=\lambda(\alpha_i|\omega_j) 表示当实际类型为\omega_j 时误判为 \omega_i 所引起的损失。自然得到以下结论:

 4 分类器、判别函数与判决区域

        之前我们了解了如何用后验概率与风险函数决策,这些可以被称为模式分类器,有很多种方式来表示模式分类器,其中用的最多的是一种判别函数g(x),如果对于i j:

g_i(\textbf{x})>g_j(\textbf{x})

则此分类器将特征向量 x 判为\omega_i,此分类器可视为一个计算c个判别函数并选取最大判别值对应的类型的网络

         简单的分类器可以表示为后验概率或条件风险的负值,这样能让最大的判别函数与最小的条件风险对应,判别函数的选择不是唯一的,我们可以将所有判别函数乘上一个常量c,更一般的将每个g_i(x)替换为f(g_i(x)),其中 f 是一个单增函数,分类结果不变,下面是一些常用的判决函数,其中第四个比较重要:

  • g_i(x)= -R(\alpha_i|\mathbf{x})
  • g_i(x)=P(\omega_i|\mathbf{x})
  • g_i(x)=p(\mathbf{x}|\omega_i)P(\omega_i)
  • g_i(x)=lnp(\mathbf{x}|\omega_i)+lnP(\omega_i)

        判决函数的形式多样,但判决规则是相同的,每种判决规则均是将特征空间分成c个判决区域:R_1,...R_c 如果对于所有的 j != i 有g_i(x)>g_j(x) ,那么x属于 R_i ,将x分为 \omega_i 类。


http://chatgpt.dhexx.cn/article/ikgKeUTc.shtml

相关文章

贝叶斯公式/贝叶斯法则/贝叶斯定理

介绍 贝叶斯法则 贝叶斯定理是用来做什么的?简单说,概率预测:某个条件下,一件事发生的概率是多大? wiki 把为什么要做这个定理谈的很清楚,是为了覆盖逆概的场景: 在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”,如“假设袋子里面有N个白球,M个黑球,你伸手…

从贝叶斯公式到贝叶斯判别准则

原来线性判别分析、平方判别分析、朴素贝叶斯这么简单直白。 前方将出现大量数学公式推导证明,为防止烦躁不适,先复习一下几个重要概念。 1.1一维高斯变量X~N(μ,),则概率密度函数 1.2多维高斯变量 ,X~N(μ,∑) , μ 为p维向量,…

Bayes' Rule-贝叶斯定理

一.基本的BayesRule 基本贝叶斯定理 贝叶斯定理是关于随机事件A和B的 条件概率(或 边缘概率)的一则定理。 其中P(A|B)是在B发生的情况下A发生的可能性。 在贝叶斯定理中,每个名词都有约定俗成的名称: P(A)是A的先验概率或边缘概率…

概率论的学习整理5:贝叶斯(bayes)法则和贝叶斯概率

1 贝叶斯(bayes)概率的思考过程 我觉得,bayes公式需要先理解条件概率,全概率公式才行纯从bayes公式的角度,其实是从 条件概率P(B | A) 开始,推导到联合概率P(AB) / P(A) ,然后再展开条件概率本…

贝叶斯法则概要

贝叶斯法则 贝叶斯分类算法是一大类分类算法的总称 贝叶斯分类算法以样本可能属于某类的概率来最为分类的依据 朴素贝叶斯 朴素贝叶斯是基于贝叶斯定理与特征条件独立假设的分类方法。其中“朴素”的意思就是条件概率独立性。 朴素贝叶斯的思想:如果一个事物在一…

AI —— Bayes Rule

重点一、Bayes’ Rule 贝叶斯法则 P(a | b) P(b) P(a, b) P(b | a) P(a) P(a | b) P(b | a) P(a)/P(b) 基础概率论知识: 全概率公式》由条件推结论 贝叶斯公式》由结论去判断条件 重点二、条件独立 绝对独立: P(x,y) P(x)P(y) P(x|y) P(x) or …

shell--pushd和popd

Linux有三个关于目录切换的常用命令,分别是cd,pushd,popd。 pushd cd用于切换工作目录,但是如果你在两个目录之间需要频繁切换时,比如/root/admin和/root/user,那这样一直cd会很麻烦,还容易出错,此时用pus…

Linux中pushd和popd用法

linux命令pushd和popd使用方法 与linux cd命令相似,用pushd实现在不同目录间切换 在命令行模式下,当你工作在不同目录中,你将发现你有很多时间都浪费在重复输入上如果这些目录不在同一个根目录中,你不得不在转换时输入完整的路径名&#xff0…

批处理命令PUSHD和POPD

随时随地阅读更多技术实战干货,获取项目源码、学习资料,请关注源代码社区公众号(ydmsq666) PUSHD: 语法: PUSHD [path | ..] Path 指定当前目录更改后的目录。该命令支持相对路径。 /? 在命令提示符下显示帮助。 POPD 语法 popd 参数 /…

ISO/IEC 5055:软件代码质量的标尺

本文分享自华为云社区《自动源代码质量度量(ISO/IEC 5055)》,原文作者:Uncle_Tom 。 ISO 5055是首个直接从软件内部结构方面衡量软件质量(如安全性和可靠性)的ISO标准。该标准基于统计安全性、可靠性、可维…

ISO-15031/ISO-15765 诊断说明

注:15765诊断可参考15031,两者诊断逻辑相同 1: ISO15031 目录说明 ISO15031-1: 这里边介绍的是一般信息和用例定义; ISO15031-2: 术语、定义、缩写词和首字母缩写词[技术报告] ISO15031-3: 这里边主要介绍了诊断连接器及相关电路&#xff1…

UDS——ISO15765

目录 一、前言 二、术语 三、网络层报文 四、网络传输 五、网络层地址格式 六、错误识别和处理 一、前言 ISO15765-2定义了诊断模型中TP网络传输层对于不同CAN报文格式单帧和多帧的处理方式。ISO15765目的是为了解决ISO 11898协议中定义的经典CAN数据链路层与ISO 14229协…

法规标准-UN R152标准解读

UN R152是做什么的? UN R152 全名为关于M1和N1型机动车高级紧急制动系统(AEBS)型式认证的统一规定,是联合国对于M1和N1型车辆AEBS系统认证的要求说明,当满足其要求内容时,才可通过联合国的认证&#xff0c…

法规标准-ISO 17361标准解读

ISO 17361是做什么的? ISO 17361全称为智能交通系统-车道偏离警告系统性能要求和测试程序,其中主要描述了LDWS系统的功能要求及测试要求 ,由于GB/T 26773与此文档内容相同,故不再对其重复解读 系统功能 车道偏离警告系统的功能…

ISO15765协议

ISO 15765 网络层协议分析 ISO 15765 网络层的功能主要有: (1)为上层的应用层提供接口服务。 (2)进行内部操作。为上层服务提供接口从而实现数据交流;主要有为对等实体间的通信提供分段、重组和流控制这几…

去哪查阅ISO国际标准?

ISO官网 访问ISO官网,不需要翻墙,只要懂点英文就行。 ISO官网地址:https://www.iso.org/(可进行全面了解、购买付费内容) ISO部分公开标准下载地址:https://standards.iso.org/ittf/PubliclyAvailableSt…

法规标准-ISO 20900标准解读

ISO 20900是做什么的? ISO 20900全名为智能交通系统-部分自动泊车系统(PAPS)-性能要求和试验程序,其中主要是对PAPS系统的功能要求、性能要求及测试步骤进行了介绍 PAPS类型 I类型PAPS系统反应 II类型PAPS系统反应 一般要求 运行期间的最大速度 系统…

国际标准 ISO 11898 解读

从 1993 第一个版 CAN 国际标准(ISO 11898:1993 和 ISO 11519-2)发布至今,ISO 11898 逐渐被分割整合成了相互独立的 6 个部分。分别以 Part 1 ~ Part 6 来标识。在旧版本(2003年之前)中 ISO 11898 是通信速度为 5kbps - 1Mbps 的 CAN 高速通信标准。规范中同时定义了 数据…

ISO 14229、ISO 15765、ISO 11898的区别

文章目录 前言ISO 11898ISO 14229ISO 15765ISO 26262ISO 27145-4 前言 最近在做车载诊断相关的工作,对于ISO 14229一点都不熟悉,开发起来进度很慢,也非常痛苦。分不清ISO 14229、ISO 15765、ISO 11898之间有啥联系和区别。下面简单介绍一下这…

ISO15031 DTC

好久不更新了,本来像分享 许飞的 父亲的散文诗 这首歌的,然而QQ音乐找不到原唱,还是算了。因为翻唱听不出鼻子一酸的味道。也许不久的将来,我也会成为某人的父亲,也会做这么一首诗,也会给自己两拳。 正文…