从贝叶斯公式到贝叶斯判别准则

article/2025/11/9 16:25:54

原来线性判别分析、平方判别分析、朴素贝叶斯这么简单直白。

前方将出现大量数学公式推导证明,为防止烦躁不适,先复习一下几个重要概念。

1.1一维高斯变量X~N(μ,),则概率密度函数

                                           

1.2多维高斯变量 ,X~N(μ,∑) , μ 为p维向量, 维的方差协方差矩阵:

                            

1.3贝叶斯公式:

                                                      

P(A|B)表示B事件发生时A事件发生的概率,往往不能直接求,而P(B|A)求起来较为方便。在这里,P(A) 为事件A发生的先验概率(prior probability)(先验概率就是指根据以往经验和分析得到的概率,可以是相对客观或者存在主观偏差的,比如抛硬币在历史上正反面的概率各是1/2,这就是在无数历史实验得到的客观准确概率)。P(A|B)为后验概率(posterior probability),即条件概率。

下面进入正题:对于常见的分类任务(classification),设表示类别的随机变量Y的样本空间{1,2,……,K},对于样本 属于第k 类的概率:

                                                     

依据全概率公式将上式分母展开:

                                                                         

其中 是随机选择的样本观测值来自第 类的先验概率。

2.1.当 为标量值(scalar)时,

                                           

 

注意到分母对于 都是一样的,其中参数 ,都需要从样本数据集中估计得到。要确定该样本属于哪一类,只有找到使得下式分子最大的k值(防止计算溢出取对数)。

                                                          

如果K=2且 (常见的二分类且样本类别均衡),分类器将 判定为第一类

                             

的估计如下:

                                                   

                                                            

2.1 Linear Discriminant Analysis

为向量时,即随机变量 ,

多元随机变量的高斯分布密度函数:

                                       

在此给出与标量情况相同的假设

                            

从上式中可以看出:决策函数 的线性函数(所以称为Linear Discriminant Analysis), 这一项表明样本类别的不均衡可能对条件概率值有影响。为方便后期写代码,这里把各个向量长度或矩阵维度列一下:

                                

 

当K=2时并且  (二分类问题),

                      

2.2Quadratic Discriminant Analysis

当给出更弱的假设:属于第k类观测向量

                                      

为方便后期写代码,这里把各个向量长度或矩阵维度列一下:

 

                                                  

 来看,决策函数与 相关

2.3Naïve Bayesian Classifier

在计算第k类的概率分布时需要计算协方差矩阵,计算复杂度为O(kp^2),在这里可以进一步简化,假设 的各个属性独立,由此计算复杂度降为O(kp):

                                            

 

                                    

                                            

所以剩下的任务就是从样本数据集估计 了。

2.4Laplacian correction

为了避免因训练样本不充分导致的概率估值为0,需要进行拉普拉斯修正,设 为训练集D(大小为|D|)中的可能类别数, 为第i属性可能的取值数, 为训练集D中属于第k类的样本数。

                                                        

参考文献:1.《The Elements of Statistical Learning》  2.《The Introduction to Statistical Learning》

 


http://chatgpt.dhexx.cn/article/Mb212o16.shtml

相关文章

Bayes' Rule-贝叶斯定理

一.基本的BayesRule 基本贝叶斯定理 贝叶斯定理是关于随机事件A和B的 条件概率(或 边缘概率)的一则定理。 其中P(A|B)是在B发生的情况下A发生的可能性。 在贝叶斯定理中,每个名词都有约定俗成的名称: P(A)是A的先验概率或边缘概率…

概率论的学习整理5:贝叶斯(bayes)法则和贝叶斯概率

1 贝叶斯(bayes)概率的思考过程 我觉得,bayes公式需要先理解条件概率,全概率公式才行纯从bayes公式的角度,其实是从 条件概率P(B | A) 开始,推导到联合概率P(AB) / P(A) ,然后再展开条件概率本…

贝叶斯法则概要

贝叶斯法则 贝叶斯分类算法是一大类分类算法的总称 贝叶斯分类算法以样本可能属于某类的概率来最为分类的依据 朴素贝叶斯 朴素贝叶斯是基于贝叶斯定理与特征条件独立假设的分类方法。其中“朴素”的意思就是条件概率独立性。 朴素贝叶斯的思想:如果一个事物在一…

AI —— Bayes Rule

重点一、Bayes’ Rule 贝叶斯法则 P(a | b) P(b) P(a, b) P(b | a) P(a) P(a | b) P(b | a) P(a)/P(b) 基础概率论知识: 全概率公式》由条件推结论 贝叶斯公式》由结论去判断条件 重点二、条件独立 绝对独立: P(x,y) P(x)P(y) P(x|y) P(x) or …

shell--pushd和popd

Linux有三个关于目录切换的常用命令,分别是cd,pushd,popd。 pushd cd用于切换工作目录,但是如果你在两个目录之间需要频繁切换时,比如/root/admin和/root/user,那这样一直cd会很麻烦,还容易出错,此时用pus…

Linux中pushd和popd用法

linux命令pushd和popd使用方法 与linux cd命令相似,用pushd实现在不同目录间切换 在命令行模式下,当你工作在不同目录中,你将发现你有很多时间都浪费在重复输入上如果这些目录不在同一个根目录中,你不得不在转换时输入完整的路径名&#xff0…

批处理命令PUSHD和POPD

随时随地阅读更多技术实战干货,获取项目源码、学习资料,请关注源代码社区公众号(ydmsq666) PUSHD: 语法: PUSHD [path | ..] Path 指定当前目录更改后的目录。该命令支持相对路径。 /? 在命令提示符下显示帮助。 POPD 语法 popd 参数 /…

ISO/IEC 5055:软件代码质量的标尺

本文分享自华为云社区《自动源代码质量度量(ISO/IEC 5055)》,原文作者:Uncle_Tom 。 ISO 5055是首个直接从软件内部结构方面衡量软件质量(如安全性和可靠性)的ISO标准。该标准基于统计安全性、可靠性、可维…

ISO-15031/ISO-15765 诊断说明

注:15765诊断可参考15031,两者诊断逻辑相同 1: ISO15031 目录说明 ISO15031-1: 这里边介绍的是一般信息和用例定义; ISO15031-2: 术语、定义、缩写词和首字母缩写词[技术报告] ISO15031-3: 这里边主要介绍了诊断连接器及相关电路&#xff1…

UDS——ISO15765

目录 一、前言 二、术语 三、网络层报文 四、网络传输 五、网络层地址格式 六、错误识别和处理 一、前言 ISO15765-2定义了诊断模型中TP网络传输层对于不同CAN报文格式单帧和多帧的处理方式。ISO15765目的是为了解决ISO 11898协议中定义的经典CAN数据链路层与ISO 14229协…

法规标准-UN R152标准解读

UN R152是做什么的? UN R152 全名为关于M1和N1型机动车高级紧急制动系统(AEBS)型式认证的统一规定,是联合国对于M1和N1型车辆AEBS系统认证的要求说明,当满足其要求内容时,才可通过联合国的认证&#xff0c…

法规标准-ISO 17361标准解读

ISO 17361是做什么的? ISO 17361全称为智能交通系统-车道偏离警告系统性能要求和测试程序,其中主要描述了LDWS系统的功能要求及测试要求 ,由于GB/T 26773与此文档内容相同,故不再对其重复解读 系统功能 车道偏离警告系统的功能…

ISO15765协议

ISO 15765 网络层协议分析 ISO 15765 网络层的功能主要有: (1)为上层的应用层提供接口服务。 (2)进行内部操作。为上层服务提供接口从而实现数据交流;主要有为对等实体间的通信提供分段、重组和流控制这几…

去哪查阅ISO国际标准?

ISO官网 访问ISO官网,不需要翻墙,只要懂点英文就行。 ISO官网地址:https://www.iso.org/(可进行全面了解、购买付费内容) ISO部分公开标准下载地址:https://standards.iso.org/ittf/PubliclyAvailableSt…

法规标准-ISO 20900标准解读

ISO 20900是做什么的? ISO 20900全名为智能交通系统-部分自动泊车系统(PAPS)-性能要求和试验程序,其中主要是对PAPS系统的功能要求、性能要求及测试步骤进行了介绍 PAPS类型 I类型PAPS系统反应 II类型PAPS系统反应 一般要求 运行期间的最大速度 系统…

国际标准 ISO 11898 解读

从 1993 第一个版 CAN 国际标准(ISO 11898:1993 和 ISO 11519-2)发布至今,ISO 11898 逐渐被分割整合成了相互独立的 6 个部分。分别以 Part 1 ~ Part 6 来标识。在旧版本(2003年之前)中 ISO 11898 是通信速度为 5kbps - 1Mbps 的 CAN 高速通信标准。规范中同时定义了 数据…

ISO 14229、ISO 15765、ISO 11898的区别

文章目录 前言ISO 11898ISO 14229ISO 15765ISO 26262ISO 27145-4 前言 最近在做车载诊断相关的工作,对于ISO 14229一点都不熟悉,开发起来进度很慢,也非常痛苦。分不清ISO 14229、ISO 15765、ISO 11898之间有啥联系和区别。下面简单介绍一下这…

ISO15031 DTC

好久不更新了,本来像分享 许飞的 父亲的散文诗 这首歌的,然而QQ音乐找不到原唱,还是算了。因为翻唱听不出鼻子一酸的味道。也许不久的将来,我也会成为某人的父亲,也会做这么一首诗,也会给自己两拳。 正文…

ISO11898/ISO14229/ISO14230/ISO15031/ISO15765标准对比简介

各行各业都有很多的国际标准和规范,汽车行业也不例外,经常遇到一套一套的标准和规范,什么ISO11898,ISO14229,ISO14230,ISO15031,ISO15765等等,这些标准规范到底是干啥的,…

手把手教会你CAN原理和电路设计

目录 1 CAN是什么 2 CAN的特点和基本概念 2.1 CAN的特点 2.2 CAN的基本概念 3 CAN协议 3.1 IOS标准 3.2 CAN协议 4 CAN原理图设计 4.1 ISO1050--TI CAN收发器应用 4.1.1 特性和功能框图 4.1.2 引脚定义和电气特性 4.1.3 CAN总线状态和芯片应用要点 5 CAN资料…