贝叶斯估计原理及流程

article/2025/10/8 13:23:29

知乎上有个专题叫:你对贝叶斯统计有怎样的理解?本篇尽量通俗点理解下贝叶斯统计~_~

还是沿用经典案例:

一种癌症,得了这个癌症的人被检测出为阳性的几率为90%,未得这种癌症的人被检测出阴性的几率为90%,而人群中得这种癌症的几率为1%,一个人被检测出阳性,问这个人得癌症的几率为多少?

假设 A 表示事件 “测出阳性”,  B1 表示“得癌症”,B2 表示“未得癌症”,那么:

P(A|B_{1}) = 0.9, P(A|B_{2}) = 0.1, P(B_{1}) = 0.01, P(B_{2}) = 0.99

再来看一下联合概率:人群中检测为阳性并且得癌症的几率:

P(B_{1},A) = P(B_{1}) \cdot P(A|B_{1}) = 0.01 \times 0.9 = 0.009

检测为阳性但未得癌症的概率:

P(B_{2},A) = P(B_{2}) \cdot P(A|B_{2}) = 0.99 \times 0.1 = 0.099

下面开始贝叶斯的功力所在了:“怎样求出在检测出阳性的前提下得癌症的概率呢?”根据上面的结果,
P(B_{1}|A)= =\frac{0.009}{0.099 + 0.009} \approx 0.083

这个问题中:人群中患癌症与否的概率是先验概率,先验概率是已知的,根据观测值:是否为阳性,来判断得癌症的后验概率。


似然函数与最大似然估计:

上面公式中的 f(x|θ) 就是一种似然函数,观测到样本x 的分布是在以某个参数θ为前提下得出来的,只是这个参数是未知的,在统计学里常用的求该参数的方法就是:最大似然估计了。

假设我们有n个样本 x_1, x_2, x_3, ..., x_n, 它们每一个变量都对应一个似然函数:

f(x_1|\theta), f(x_2|\theta), ..., f(x_n|\theta)

把这些似然函数乘起来:

lik(\theta) = \prod_{i=1}^{n} f(x_i|\theta)

只要找到令这个函数最大的 θ 值,就是我们想要的参数值了。

朴素贝叶斯:

对于给出的待分类项,求出在此分类项出现的情况下各个类别出现的概率,哪个最大,就认为待分类项属于哪个类别。即在没有其它可用的信息时,选择条件概率最大的类别。朴素贝叶斯分类的定义如下:

      1、设为待分类项,a为x的一个特征属性。

      2、类别集合 

      3、计算 

      4、去最大概率值 ,则 

     关键一步在于如何计算第3步中的条件概率。通常采用的做法是:

      1、找到一个已知分类的待分类项集合,作为训练样本集。

      2、统计在各个类别下各特征属性的条件概率估计:

           

      3、如果各个特征属性是条件独立的,即符合马尔科夫模型,则贝叶斯定理成立:

          

      P(x)对于所有类别都是一个常数,所以取极值就变为将分子最大化:        

朴素贝叶斯分类的流程:

(1)准备工作阶段。主要是根据具体情况确定特征属性,并对特征属性进行划分,由人工对一部分待分类项进行分类,形成训练样本集合。这一阶段的输入是待分类数据,输出是特征属性和训练样本。这一阶段需要人工完成的,对整个过程有重要影响,分类器的质量很大程度上由特征属性、特征属性划分及训练样本的质量决定。

(2)分类器训练阶段。主要是计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率估计,并将结果记录。其输入是特征属性和训练样本,输出是分类器。

(3)应用阶段。使用分类器对待分类项进行分类,输入分类器和待分类项,输出待分类项与类别的映射关系。

注:当P(a|y)=0,即某个类别下某个特征项划分没有出现,这会令分类器质量大大降低。为了解决这个问题,通常对没类别下所有划分的计数加1,这样如果训练样本集数量充分大时,并不会对结果产生影响,并且解决了上述频率为0的尴尬局面。


http://chatgpt.dhexx.cn/article/BCWPZMmS.shtml

相关文章

极大似然估计和贝叶斯估计

转载于http://blog.sciencenet.cn/blog-520608-703219.html 极大似然估计和贝叶斯估计分别代表了频率派和贝叶斯派的观点。频率派认为,参数是客观存在的,只是未知而矣。因此,频率派最关心极大似然函数,只要参数求出来了&#xff0…

贝叶斯方法的m-估计

为什么要有m-估计? 当我们通过在全部事件的基础上观察某事件出现的比例来估计概率时,例如:Pnc/n.,其中nc为该类别中的样本数量,n为总样本数量。若n5,当P0.6时,则nc为3。多数情况下该比例是对概率…

参数估计—最大似然估计与贝叶斯估计

文章目录 一 参数估计二 最大似然估计2.1 参数分量2.2 基本原理2.3 高斯情况2.3.1 协方差矩阵 Σ \Sigma Σ已知,而均值 μ \mu μ未知2.3.2 协方差矩阵 Σ \Sigma Σ和均值 μ \mu μ都未知 三 贝叶斯估计3.1 基本原理3.2 高斯情况下的贝叶斯估计3.2.1 单变量情况第…

朴素贝叶斯算法与贝叶斯估计

在看贝叶斯算法的相关内容时,你一定被突如其来的数学概念搞得头昏脑涨。比如极大似然估计(Maximum likelihood estimation ),极大后验概率估计(Maximum a posteriori estimation),先验概率(Prior probability),后验概率(Posterior…

几个贝叶斯估计的例题

几个贝叶斯估计的例题 以下例题来自《机器学习导论》,书中证明不是很全也没有推导过程,所以我补全了解答。 贝叶斯估计 Dirichlet分布 已知方差的正态分布 正态分布 此时不再是共轭后验先验分布了,会得到一个t分布,由于涉及的特殊…

贝叶斯估计实验(matlab)

1、实验内容 由于生活中很多参数如测量误差、产品质量指标等几乎都服从或近似服从正态分布,所以可以用对单变量正态分布中的贝叶斯估计进行分析并编写相应的Matlab程序,分析样本大小对贝叶斯估计误差的影响,进而验证贝叶斯估计的有效性。 2…

参数估计:贝叶斯思想和贝叶斯参数估计

http://blog.csdn.net/pipisorry/article/details/51471222 贝叶斯与频率派思想 频率派思想 长久以来,人们对一件事情发生或不发生,只有固定的0和1,即要么发生,要么不发生,从来不会去考虑某件事情发生的概率有多大&a…

贝叶斯估计及其python实现

文章目录 1.贝叶斯估计的思想2.正态总体参数贝叶斯估计的推导3.代码实现3.1.抽取样本3.2.估计参数 4.总结参考文献 1.贝叶斯估计的思想 在统计学中有两大学派:频率学派和贝叶斯学派。针对参数估计的方法也分成两派。其中以极大似然估计为代表的频率学派和以贝叶斯估…

贝叶斯估计和极大似然估计到底有何区别

前言:原创不易,转载请告知并注明出处!微信搜索【机器学习与自然语言处理】公众号,定期发布知识图谱,自然语言处理、机器学习等知识,添加微信号【17865190919】进讨论群,加好友时备注来自CSDN。 …

【数学基础】参数估计之贝叶斯估计

从统计推断讲起 统计推断是根据样本信息对总体分布或总体的特征数进行推断,事实上,这经典学派对统计推断的规定,这里的统计推断使用到两种信息:总体信息和样本信息;而贝叶斯学派认为,除了上述两种信息以外…

贝叶斯估计与贝叶斯学习的区别

概述: 贝叶斯估计:贝叶斯估计是把待估计的参数看作具有先验分布密度p()的随机变量,其取值与样本D有关,用训练样本D估计出最优的,记为。 贝叶斯学习 :把贝叶斯估计的原理用于直接从数据对概率密度函数进行…

vue3页面刷新

整理工作中用到的页面刷新方式&#xff1a; 1.provide/inject 2.router.go(0) 3.provide,inject 一、使用provide和inject 控制<router-view>的显示隐藏 默认<router-view v-if"isRouterAlive" /> isRouterAlive是true&#xff0c;在需要刷新的时候把这…

js 页面刷新

刷新为新的页面 获得当前页面的url,即浏览器显示的地址: window.location.href; 按下enter,页面刷新为百度 刷新为当前页面 1,history.go(0)2,location.reload() 3,location=location 4,location.assign(location) 5,document.execcommand(‘refresh‘) 6,window.na…

Web页面自刷新

简单介绍两种&#xff1a; 第一种Ajax Ajax Asynchronous JavaScript and XML&#xff08;异步的 JavaScript 和 XML&#xff09;&#xff0c;ajax就是基于浏览器提供的XMLHttpRequest对象来实现的 什么叫异步&#xff1f; 异步&#xff0c;不同的意思&#xff0c;这里也就…

页面刷新技术-------AJAX

一、前提步骤&#xff08;先把静态网页写出来&#xff09; 1、首先先要配置文件 2、然后去后端建立服务器&#xff0c;把该下载的模块下载好 var httprequire("http") var fsrequire("fs") var urlrequire("url") var querystringrequire(&quo…

页面刷新和vue页面刷新

history.go(0) location.reload() locationlocation location.assign(location) document.execCommand(Refresh) window.navigate(location) location.replace(location) document.URLlocation.href这几个都可以刷新&#xff1a; window.location.reload();刷新 window.locatio…

vue关于页面刷新的几个方式

在写项目的时候会遇到需要刷新页面重新获取数据&#xff0c;浅浅总结了一下几种方案。 1.this.$router.go(0) 强制刷新页面&#xff0c;会出现一瞬间的白屏&#xff0c;用户体验感不好。 2.location.reload() 也是强制刷新页面&#xff0c;和第一种方法一样&#xff0c;会造成…

HTML页面刷新及其应用例子

HTML页面刷新及其应用例子 刷新一般指重新载入当前页面。本文先给出html页面刷新重载方法汇总&#xff0c;再给出示例。 html页面刷新重载方法汇总 一、javascript页面刷新重载的方法&#xff1a; <a href"javascript:location.reload();">点击重新载入页面…

vue页面刷新

vue页面刷新 首先我们都知道vue属于单页面应用&#xff0c;默认境况下是不会触发刷新页面操作的&#xff0c;所以这个时候就需要我们通过事件来触发reload()来达到刷新操作 接下来我就为大家介绍三种刷新页面的方法 1. wiindow.location.reload([bForceGet])该方法强迫浏览…

hadoop 学习路线

Posted: Sep 6, 2013 Tags: Hadoophadoop familyroadmap Comments: 40 Comments Hadoop家族学习路线图 Hadoop家族系列文章&#xff0c;主要介绍Hadoop家族产品&#xff0c;常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa&am…