[work*] 贝叶斯公式的通俗解释

article/2025/9/24 11:16:38

本文节选自《人类最美的54个公式》 转自量子位

我思故我在

 

我思故我在

AI背后的神秘公式

 

近代哲学奠基人,伟大的笛卡尔说出“我思故我在”时,上帝震惊了。

 

第一个被赋予公民身份的机器人Sophia(索菲娅)被问到:你怎么知道自己是机器人?Sophia的回答是:你怎么知道自己是人类?

 

机器人会反驳了,这到底是新世纪的福音,还是人类的转折?

 

AI(人工智能)已经不再是完全被动地向人类表述世界,而开始主观性地表达意见。

 

Google自动驾驶汽车的操纵系统,G-mail对垃圾邮件的处理,MIT主导的人类“写字”系统,以及最新的SIRI智能语音助手平台,还有挑战人类最后智慧堡垒的AlphaGo系统,都已经开始了“深度学习”暴风雨式革命。

 

这几年,机器智能向“我思故我在”这个哲学命题步步逼近,一只神秘之手躲在后面操纵,它就是贝叶斯公式。

 

当科学在证明自己对世界的客观认知时,贝叶斯公式却融入了人类的主观性。

 

 

 

 

1

“不科学”的贝叶斯-拉普拉斯公式

 

贝叶斯定理是18世纪英国数学家托马斯·贝叶斯提出的概率理论。

 

该定理源于他生前为解决一个“逆概”问题写的一篇文章,在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”,如“假设袋子里面有P只螃蟹,Q只蜘蛛,你伸手进去摸一把,摸到螃蟹的概率是多大”。但反过来看:“如果我们事先并不知道袋子里面螃蟹和蜘蛛的比例,而是闭着眼睛摸出一只(或好几只)螃蟹,那么我们可以就此对袋子里面的螃蟹和蜘蛛的比例作出什么样的推测。”这个问题就是逆向概率问题。

 

这个研究看起来似乎简单而平淡无奇,直到他死后的两年才于1763年发表。它的数学原理很容易理解,就像一个迷信星座的HR,如果你碰到一个处女座的应聘者,你会推断那个人多半是一个追求完美的人。这就是说,当你不能准确知悉某个事物本质时,你可以依靠经验去判断其本质属性的概率。与其他统计学方法不同,贝叶斯方法建立在主观判断的基础上,让人感觉不科学,这也是它200多年来不为科学家们待见的原因。

 

除了贝叶斯,1774年,法国数学家拉普拉斯也非常“不科学”地发现了贝叶斯公式。这位创立了大名鼎鼎的谛听神兽拉普拉斯兽的科学家,给出了我们现在所用的贝叶斯公式的表达:

 

 

该公式表示在B事件发生的条件下A事件发生的条件概率,等于A事件发生条件下B事件发生的条件概率乘以A事件的概率,再除以B事件发生的概率。公式中,P(A)也叫做先验概率,P(A/B)叫做后验概率。

 

像微积分公式的全称是“牛顿-莱布尼茨公式”一样,贝叶斯公式至少应被称为“贝叶斯-拉普拉斯公式”才科学。

 

 

 

 

2

今天天气怎样?

贝叶斯公式是这样工作的

 

贝叶斯定理并不好懂,它到底是如何为人民服务的?

对于贝叶斯定理,参照上面的公式,首先要了解各个概率所对应的事件。

 

P(A|B)是在B发生的情况下A发生的概率;

P(A)是A发生的概率;

P(B|A)是在A发生的情况下B发生的概率;

P(B)是B发生的概率。

 

就知道你没看懂……那我还是举个经常用到的例子吧!

 

量子学派CEO良心发现放假10天,量子妹约定帅哥去爬梧桐山,希望玩到人约黄昏后占点便宜,然而天公不作美,一大早天空多云。

 

 

这可怎么办?60%的雨天的早上是多云的。帅哥说,不玩了吧。

 

量子妹当然不甘心,劝说帅哥:

1、多云不见得会下雨,大约30%日子早上是多云的!

2、深圳天气平均一个月才会3天下雨,10%的概率而已。

 

帅哥并不是绣花枕头,非常科学地用“贝叶斯公式”计算:

用“雨”来代表今天下雨,“云”来代表早上多云。

当早上多云时,当天会下雨的可能性是P(雨|云)。

 

P(雨|云) = P(雨)·P(云|雨) /P(云)

P(雨) 是今天下雨的概率 = 10%

P(云|雨) 是在下雨天早上有云的概率 = 60%

P(云) 早上多云的概率 = 30%

那么,贝叶斯定理的答案就出来了

P(雨|云) =0.1×0.6/0.3=0.20

 

帅哥毫无表情地说:今天下雨的概率是20%,可以去爬山。

 

量子妹看着美得不食人间烟火的帅哥,怯生生地问:你真的是人吗?

 

帅哥毫无表情地回答:我不是人,我是阿尔法狼。

 

 

 

 

3

贝叶斯公式如何逐步取得人类信任

 

今天的贝叶斯理论开始遍布一切。从物理学到癌症研究,从生态学到心理学。

 

物理学家提出了量子机器的贝叶斯解释,以及贝叶斯捍卫了弦和多重宇宙理论。

哲学家主张作为一个整体的科学可以被视为一个贝叶斯过程。

贝叶斯定理就快成像“热力学第二定律”一样放之四海皆准了。

特别是在IT界,AI大脑的思考和决策过程,被更多工程师设计成一个贝叶斯程序。

 

但贝叶斯诞生以来命途多舛,长期以来因为表面的不科学,并没有得到主流学界认可。

 

其实在日常生活中,我们也常使用贝叶斯公式进行决策。比如我们到河边钓鱼,根本就看不清楚河里哪里有鱼或者没鱼,似乎只能随机选择,但实际上我们会根据贝叶斯方法,利用以往积累经验找一个回水湾区开始垂钓。这就是我们根据先验知识进行主观判断,在钓过以后对这个地方有了更多了解,然后再进行选择。所以,在我们认识事物不全面的情况下,贝叶斯方法是一种非常理性且科学的方法。

 

 

贝叶斯公式得到主流科学界的认可,主要因为两件事:

 

1、《联邦党人文集》作者揭密

1788年,《联邦党人文集》匿名出版,作者汉密尔顿和麦迪逊写作风格几乎一致。两个人都逝世后,要找出每一篇文章的作者极其困难,哈佛大学通过对词汇的贝叶斯研究方法最终找出了每一篇的文章作者,研究方法在统计学界引发震动,被禁锢了200年的贝叶斯公式从魔盒里被释放出来。

 

2、美国天蝎号核潜艇搜救

1968年5月,美国海军天蝎号核潜艇在大西洋亚速海海域失踪。军方通过各种技术手段调查无果,最后不得不求助于数学家John Craven,John Craven提出的方案使用了贝叶斯公式,他召集了数学、潜艇、海事搜救等各个领域的专家,一边掷骰子一边通过贝叶斯公式一一排除小概率发生意外事故的搜索区域。

 

 

2014年初马航MH370航班失联后,科学家想到第一个方法就是利用贝叶斯定理开始区域搜索,这个时候,贝叶斯公式已经名满天下了。

 

 

 

4

语音识别

贝叶斯公式开始展示“神迹”

 

科大讯飞因为语音识别成为千亿级市值公司,首先得感谢贝叶斯公式和马尔科夫链。

 

自然语音处理一直是科学家面临的最大难题,在计算机语言处理领域,近几年引入了贝叶斯公式和马尔科夫链才有了长足进步(这里不详细介绍马尔科夫链)。
 

文字翻译尚可理解,但语音涉及各种动态语法,机器怎么知道你在说什么鸟语?
 

但当你在现场看到机器翻译的准确性,会感叹这简直就是“神迹”,比大部分现场翻译要强得多。
 
一旦出现条件概率,贝叶斯总能挺身而出。
我们用P(f|e)区别于以上的P(A|B)来解释语音识别功能。

 

统计机器翻译的问题可以描述为:给定一个句子e,它可能的外文翻译f中哪个是最靠谱的。即我们需要计算:P(f|e)。
 

P(f|e) ∝ P(f) * P(e|f)
 

这个式子的右端很容易解释:那些先验概率较高,并且更可能生成句子e的外文句子f将会胜出。我们只需简单统计就可以得出任意一个外文句子f的出现概率。然而 P(e|f)却不是那么好求的,给定一个候选的外文局子f,它生成(或对应)句子e的概率是多大?我们需要定义什么叫“对应”,这里需要用到一个分词对齐的平行语料库。
 
率先成功利用数学方法解决自然语言处理问题的是贾里尼克,他把语音识别简化为用贝叶斯公式处理的数学问题成功开辟了一条全新的问题解决路径。
 

随着大量数据输入模型进行迭代,随着计算能力的不断提高、大数据技术的发展,贝叶斯公式巨大的实用价值愈发体现出来。
 

语音识别仅仅只是贝叶斯公式运用的一个例子,其实贝叶斯定理的思想已经渗透到AI的方方面面。

 

 

 

 

5

贝叶斯网络

AI智慧的“蜂群效应”

 

单个语音模型的建立让我们看到了贝叶斯定理解决问题的能力,但贝叶斯网络的拓展让我们隐约感觉到了AI背后“天网”的恐怖。
 

人类相对简单的问题已经解决得差不多了,剩下的都非常复杂。
 

龙卷风的形成,2的50次方可能的最小参数值比对。
癌症致病基因,2的100次方种可能的基因图谱。
星系起源,2的350次方种可能的星云数据处理。
大脑运作机制,2的1000次可能的意识量子流。

 

面对这样数理级的运算,科学家别无选择,必须从可能的法则中选择一些可以信任的,并以此为基础建立理论模型。贝叶斯公式正好以严谨的数学形式帮他们实现了这一点。科学家把所有假设与已有知识、观测数据一起代入贝叶斯公式,就能得到明确的概率值。而要破译某种现象的成因网络,只需将公式本身也结成网络,即贝叶斯网络,接下来只需要向这个模型代入观测数据,通过网络节点间的贝叶斯公式重新计算出概率值。为每个新数据、每个连接重复这种计算,直到形成一个网络图,让任意两个原因之间的连接都得到精确的概率值为止。人类认知的缺陷越大,贝叶斯网络展示的力量越让人震撼。
 

 

但这还不是最可怕的,这里我们要引入“蜂群效应”,一只个体蜜蜂,基本上没有智力,但当它们组建成一个蜂群时,就会爆发出一种整体智力,拥有记忆能力,能制造出巧夺天工的蜂巢。贝叶斯网络的每一个节点就像一只蜜蜂,这种群体的连接不仅生动,而且非常严谨,一旦这个群体达到一定数量级别,有没有可能产生整体智慧?这不仅是哲学家需要思考的问题,生命学家需要讨论的问题,AI圈的科学家也应该直接去面对。
 

今天一场轰轰烈烈的“贝叶斯革命”正在AI界发生:贝叶斯公式已经渗入到工程师的骨子里,分类算法也成为主流算法。在很多人眼中,贝叶斯定理就是AI进化论的基石。

 

 

 

 

封杀这个公式,

AI智商将为零?

 

AI人工智能第一课,都是从贝叶斯定理开始。
因为大数据、人工智能和自然语言处理中都大量用到贝叶斯公式。

我们无法预测到贝叶斯公式与计算机结合的真正威力,因为一切才刚刚开始。

 

贝叶斯公式与AI的结合,这到底是一场科学的革命,还是一场理念的革命?到底是生产方式的革命,还是人类在革自己的命?
 

当年人类科学家总结出客观的贝叶斯公式,而AI却利用这个公式给自己注射主观基因,两者颠倒,在未来到底会演绎怎样的相爱相杀故事?
 

如果真的到了决战的一天,人类到底该如何给自己留一把杀手锏?是否应该像NSA在算法里留下后门一样,抽离出这个公式,让AI无法“我思故我在”。
 

这似乎有点杞人忧天了,纵观整个社会,现在不用太担心AI像人一样思考,最应该担心人类已经失去了思考。


http://chatgpt.dhexx.cn/article/5d5qVJpq.shtml

相关文章

贝叶斯公式详解

概率论只不过是把常识用数学公式表达了出来。 ——拉普拉斯 记得读本科的时候,最喜欢到城里的计算机书店里面去闲逛,一逛就是好几个小时;有一次,在书店看到一本书,名叫贝叶斯方法。当时数学系的课程还没有学到概率统计…

通俗易懂讲解贝叶斯

0. 前言 这是一篇关于贝叶斯方法的科普文,我会尽量少用公式,多用平白的语言叙述,多举实际例子。更严格的公式和计算我会在相应的地方注明参考资料。贝叶斯方法被证明是非常 general 且强大的推理框架,文中你会看到很多有趣的应用…

贝叶斯公式的理解

作者:知乎用户 链接:https://www.zhihu.com/question/21134457/answer/169523403 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 最近我自己在学习一些关于机器学习的东西,目前学到…

贝叶斯定理的通俗理解

朴素贝叶斯是一种基于贝叶斯定理的简单概率分类器(分类又被称为监督式学习,所谓监督式学习即从已知样本数据中的特征信息去推测可能出现的输出以完成分类,反之聚类问题被称为非监督式学习),朴素贝叶斯在处理文本数据时…

贝叶斯通俗易懂推导

简介 贝叶斯定理是18世纪英国数学家托马斯贝叶斯(Thomas Bayes)提出得重要概率论理论。以下摘一段 wikipedia 上的简介: 所谓的贝叶斯定理源于他生前为解决一个“逆概”问题写的一篇文章,而这篇文章是在他死后才由他的一位朋友发…

贝叶斯公式的通俗理解

概述 贝叶斯分析是整个机器学习的基础框架 中学课本里说概率这个东西表述是一件事情发生的频率, 或者说这叫做客观概率。 贝叶斯框架下的概率理论确从另一个角度给我们展开了答案, 它认为概率是我们个人的一个主观概念, 表明我们对某个事物发…

贝叶斯公式的最通俗解释

本质上,贝叶斯公式描述了在给定新信息的情况下如何更新我们的模型。 为了理解原因,我们将看一个简单的例子:用不公平的硬币抛硬币。 假设我们有一个神奇的硬币! 抛掷时可能出现正面或反面,但概率不一定相等。 问题是&…

贝叶斯公式:通俗的理解

如上文提到的贝叶斯公式,《朴素贝叶斯分类: 使用案例》,可以使用它来做文本分类: 【已知:样本中每个分类下的单词概率ceilPencent, 样本的分类占比(也即概率分布)bodyPencent】 来了一篇文章&am…

用通俗的语言解释贝叶斯公式

传统的机器学习离不开贝叶斯,网上讲的都不够通俗。我就来用白话阐释一下。 先上公式: ​​​​​​​ ​​​​​​​ ​​​​​​​ ​​​​​​​ 这个公式讲了一个什么故事呢? 指的是,当新的…

关于贝叶斯公式的解释,通俗易懂(转载)

from: ttps://baijiahao.baidu.com/s?id1578164183121521878&wfrspider&forpc 首先,对于贝叶斯定理,还是要先了解各个概率所对应的事件。 P(A|B) 是在 B 发生的情况下 A 发生的概率; P(A) 是 A 发生的概率; P(B|A) 是…

通俗理解贝叶斯公式

前几天文工团一道考试题火了。 三个相同的盒子里各有2个球,其中一个盒子里放了2个红球,一个盒子里放了2个蓝球,一个盒子里放了红球和蓝球各一个。随即选择一个后,从中随机摸出一球是红球,则这个盒子里另一个球是红球的…

从贝叶斯定理说开去

从贝叶斯定理说开去 罗朝辉 (http://kesalin.github.io/) CC 许可,转载请署名并保留出处 简介 贝叶斯定理是18世纪英国数学家托马斯贝叶斯(Thomas Bayes)提出得重要概率论理论。以下摘一段 wikipedia 上的简介: 所谓的贝叶斯定理源于他生前为解决一个“逆概”问题写的一篇…

小白之通俗易懂的贝叶斯定理

小白之通俗易懂的贝叶斯定理 贝叶斯定理的产生以及意义什么是贝叶斯定理?贝叶斯定理的应用案例贝叶斯定理套路生活中的贝叶斯思维 转载自:https://mp.weixin.qq.com/s/lR3eeSWYHJDAJ9kJUzXc7w 贝叶斯定理的产生以及意义 1、贝叶斯定理的产生来源 英国…

通俗地理解贝叶斯公式(定理)

通俗地理解贝叶斯公式(定理) 朴素贝叶斯(Naive Bayesian algorithm)是有监督学习的一种分类算法,它基于“贝叶斯定理”实现,该原理的提出人是英国著名数学家托马斯贝叶斯。贝叶斯定理是基于概率论和统计学…

WebPack实战 WebPack打包Vue项目

文章目录 前言一、使用webpack来进行vue-cli模块化开发二、Webpack配置区分开发环境和生产环境三、vue项目打包3.1、config—index.js文件3.2、build—webpack.prod.conf.js 文件3.3、element ui 字体文件加载出错3.4、路由跳转出现js访问404问题 四、关闭Webpack的debug模式五…

vscode使用webpack打包

vscode使用webpack打包 下载webpack初始化项目打包 .js文件打包.js.csswebpack全局安装与局部安装 webpack作用就是将多个不同的.js文件或者.css文件打包为一个文件,减少请求量 有大佬的帖子写的很详细,各种资源的打包方式都有: https://blog.csdn.net/chen4565/article/detai…

webpack打包html

webpack打包html 1.生产环境与开发环境的区别2.打包html3.安装html插件4.在配置文件中引入我们的插件5.在我们的配置文件的最下方写入html配置6.打包完成生成一个index文件7.在文件中写入其他内容8.打包后的内容展示9.改变title的内容10.打包后的效果展示11.打包多个页面12.压缩…

webpack打包json文件

项目里新增了json文件,webpack报错如下: webpack本身是支持json文件读取的,这个报错是babel-loader在报错,也就是说,打包的时候,babel-loader去解析了json文件。babel是js的编译工具,可以把js、…

React 使用webpack打包

一、项目创建 1、新建一个项目文件夹,打开终端,切换到到项目目录下: npm init -y 这时候使用webstorm等高级的编辑器打开项目执行下面步骤效果会更直观。 2、新建一个文件夹public,在文件夹内创建index.html文件,添加…

webpack打包工具的基本使用

目录 一、webpack是什么? 二、webpack的基本使用 1、初始化项目 2、安装webpack及其依赖 3、使用 3.1 配置webpack: 3.2 在package.js文件中添加打包命令 3.3 执行打包命令 三、webpack相关插件 插件一:HtmlWebpackPlugin 插件二&a…