小孩都看得懂的贝塔分布

article/2025/10/15 15:14:22

全文共 1897 字,22 幅图,

预计阅读时间 10 分钟。

本文是「小孩都看得懂」系列的第十五篇,本系列的特点是内容不长,碎片时间完全可以看完,但我背后付出的心血却不少。喜欢就好!

  1. 小孩都看得懂的神经网络

  2. 小孩都看得懂的推荐系统

  3. 小孩都看得懂的逐步提升

  4. 小孩都看得懂的聚类

  5. 小孩都看得懂的主成分分析

  6. 小孩都看得懂的循环神经网络

  7. 小孩都看得懂的 Embedding

  8. 小孩都看得懂的熵、交叉熵和 KL 散度

  9. 小孩都看得懂的 p-value

  10. 小孩都看得懂的假设检验

  11. 小孩都看得懂的基尼不纯度

  12. 小孩都看得懂的 ROC

  13. 小孩都看得懂的 SVD

  14. 小孩都看得懂的 SVD 2

  15. 小孩都看得懂的 GMM

  16. 小孩都看得懂的贝塔分布

0

贝塔分布 (beta distribution) 对概率建模得到的一个概率分布。听起来很绕口,下面看一个简单示例。

1

硬币问题

三个有偏 (biased) 硬币,丢它们落下来正面的概率分别是 0.4, 0.6 和 0.8。

如果随机选一个硬币,丢五次,得到“正正正反反 (HHHTT)”,问选中的是哪一个硬币?

2

硬币 2 的正面概率是 0.6 (3/5),而丢 5 次 3 次朝上正好符合这个 3/5 的概率,那么应该是硬币 2。

但是选中的 100% 的是硬币 2 么?不是!硬币 1 和 3 也有可能被选中,只不过给定 “HHHTT”,选中的概率比选硬币 2 要小。  

要点:给定 HHHTT,硬币 2 最有可能被选中,而硬币 1 和 3 被选中的可能性小一些。没有绝对的,都是概率问题。

3

现在来计算出现 HHHTT 的概率。

  • 硬币 1:0.43 × 0.62 = 0.0230

  • 硬币 2:0.63 × 0.42 = 0.0346

  • 硬币 3:0.83 × 0.22 = 0.0205

最后标准化使得三个概率总和为 1,注意分母是三个概率的和 (spoil alert: 这个概率和贝塔函数有联系)。

最终得到选中每个硬币的概率为 0.295, 0.443 和 0.262。

4

加到十个硬币 (每个硬币丢正的概率从 0, 0.1, 0.2 到 1),任选一个丢 10 次,得到 7 正 3 反,最优可能是哪个硬币?

7 正 3 反,那么最有可能选到硬币 7 (丢正的概率为 0.7)。

那么其他硬币的呢?也有可能选中,概率计算如下表。

标准化 (除以十个概率的和) 得到下表的结果。

可视化如下。

5

将上例的十个硬币 (丢正概率为 0 到 1) 扩展到无数个硬币 (丢正概率为 p),那么任取一个硬币丢 10 次得到 7 正 3 反的概率为 p7 × (1-p)3。

将 p 从 0 到 1 分隔很多点 p(i),对每个 p(i) 计算出 p(i)7 × (1-p(i))3 并画出图。不难发现 p = 0.7 时函数值最高,即最有可能选取“丢正概率为 0.7”的硬币。

当选无限多个点 p(i) 时,就可完全填充曲线下的面积了。

得到的概率值 x7 × (1-x)3 需要被标准化才能得到一个概率分布,而这个面积的大小,在本例中表示为 B(8, 4),就是用来“标准化”概率除以的那个分母。

为什么表示为 B(8, 4) 而不是 B(7, 3),这个是惯例,即在丢正的次数 7 和丢反的次数 3 加上 1,记住就行了。

6

这样  x7(1-x)3 / B(8, 4) 就构成了一个概率分布,即贝塔分布。

将具体“丢正的次数 7 和丢反的次数 3”分别用 a 和 b 表示,那么通用的贝塔分布的概率分布函数为 xa(1-x)b / B(a+1, b+1)。

7

现在假设观测到以下三种情况:

  1. 7 正 3 反

  2. 70 正 30 反

  3. 700 正 300 反

很显然最有可能选取的硬币的丢正概率都为 0.7,但哪种情况最有信心来声称选取的硬币的丢正概率都为 0.7?

简单,将三种情况下的贝塔分布图画出即可。

三幅图相同的是,函数最大值都发生在 p = 0.7 时。

三幅图不同的是,从左到右来看,峰越来越尖,展开越来越窄,即越来越有信心声称选取的硬币的丢正概率为 0.7。

朋友们,你们弄懂了贝塔分布吗?


有兴趣学习 Python 和金融工程的同学,可以参考我自己做的精品课:

付费文章

Python 基础版 11 节目录

  1. 编程概览

  2. 元素型数据

  3. 容器型数据

  4. 流程控制:条件-循环-异常处理

  5. 函数上:低阶函数

  6. 函数下:高阶函数

  7. 类和对象:封装-继承-多态-组合

  8. 字符串专场:格式化和正则化

  9. 解析表达式:简约也简单

  10. 生成器和迭代器:简约不简单

  11. 装饰器:高端不简单

数据分析进阶课的目录

  1. NumPy 上

  2. NumPy 下

  3. Pandas 上

  4. Pandas 下

  5. SciPy 上

  6. SciPy 下

  7. Pandas 时间序列

  8. Pandas 高频数据

  9. 默顿模型 - 计量经济资本

  10. LSMC - 美式百慕大期权定价

  11. Bachelier - 负油价和负利率

  12. Nelson Siegel - 债券收益率曲线构建

  13. 外汇交易组合保证金

  14. FR007 利率掉期定价和曲线拔靴

  15. 量化交易 - 向量化回测

金融工程硬核付费文章

  1. 欧式期权 PDE FD

  2. 美式和百慕大期权 PDE FD

  3. 单障碍和单触碰期权 PDE FD

  4. 双障碍和双触碰期权 PDE FD

  5. Snowball Autocallable PDE FD

  6. 离散障碍和触碰期权 PDE FD


http://chatgpt.dhexx.cn/article/wQyhTflG.shtml

相关文章

beta分布介绍

相信大家学过统计学的都对 正态分布 二项分布 均匀分布 等等很熟悉了,但是却鲜少有人去介绍beta分布的。 用一句话来说,beta分布可以看作一个概率的概率分布,当你不知道一个东西的具体概率是多少时,它可以给出了所有概率出现的可能…

泊松过程、伽马分布、贝塔分布及狄利克雷分布

泊松过程、伽马分布、贝塔分布及狄利克雷分布 1.泊松过程1.1Poisson过程的定义1.2Poisson过程的应用 2.伽马分布2.1伽马分布的定义2.2伽马分布的性质2.3伽马分布与其他分布的关系 3.贝塔分布3.1贝塔分布的定义3.2贝塔分布的图形3.3贝塔分布的应用 4.狄利克雷分布4.1狄利克雷分布…

贝叶斯分析——分布之分布(beta分布)

转自:http://blog.sciencenet.cn/blog-677221-1049350.html 贝叶斯与逆概率问题 对于“白球黑球”的概率问题。概率问题可以正向计算,也能反推回去。 (1)盒子里有10个球,黑白两种颜色,如果我们知道10个球中5白5黑&a…

Beta分布(Beta Distribution)

定义: beta分布可以看作一个概率的概率分布,当你不知道一个东西的具体概率是多少时,它可以给出了所有概率出现的可能性大小。 举一个简单的例子,熟悉棒球运动的都知道有一个指标就是棒球击球率(batting average),就是…

推导Beta分布公式

Beta分布可以用于拟合各种不同的分布,网上各种资料对于Beta分布的原理着墨较多,却少有推导Beta分布公式的,所以,推导Beta分布公式如下: 设一组随机变量 ,将这n个随机变量排序后得到顺序统计量 &#xff0c…

Beta 分布

Beta 函数 B ( α , β ) ≜ ∫ 0 1 x α − 1 ( 1 − x ) β − 1 d x \Beta(\alpha, \beta) \triangleq \int_0^1 x^{\alpha-1}(1-x)^{\beta-1}dx B(α,β)≜∫01​xα−1(1−x)β−1dx 其中 α , β > 0 \alpha, \beta > 0 α,β>0 Beta 函数与 Gamma 函数 B ( α…

如何理解beta分布?

相信大家学过统计学的都对 正态分布 二项分布 均匀分布 等等很熟悉了,但是却鲜少有人去介绍beta分布的。 用一句话来说,beta分布可以看作一个概率的概率分布,当你不知道一个东西的具体概率是多少时,它可以给出了所有概率出现的可…

原创 | 一文读懂正态分布与贝塔分布

本文约2300字,建议阅读5分钟 本文通过案例介绍了正态分布和贝塔分布的概念。 正态分布 正态分布,是一种非常常见的连续概率分布,其也叫做常态分布(normal distribution),或者根据其前期的研究贡献者之一高斯的名字来称…

带你理解beta分布

#beta分布介绍 相信大家学过统计学的都对 正态分布 二项分布 均匀分布 等等很熟悉了,但是却鲜少有人去介绍beta分布的。 用一句话来说,beta分布可以看作一个概率的概率分布,当你不知道一个东西的具体概率是多少时,它可以给出了所…

深入理解什么是Beta分布

例一 Beta分布是一种描述概率的概率分布,这句话可能有些绕口,看一个例子: 以抛硬币为例,如果硬币是均匀的,并且正面朝上的概率记为p(p0.5),那么每一次抛硬币都可以看做是一次伯努利…

贝塔分布(beta分布)及Python实现——计算机视觉修炼之路(二)

beta分布 贝塔分布( Beta Distribution ) 是一个作为伯努利分布和二项式分布的共轭先验分布的密度函数,在机器学习和数理统计学中有重要应用。在概率论中,贝塔分布,是指一组定义在(0,1)区间的连续概率分布。其概率密度函数为&…

Beta分布(概率的概率)

目录 1.前言 2.定义 3.Beat分布的概率密度函数(PDF): 4.Beat分布的累积密度函数(CDF): 1.前言 伯努利试验(同样的条件下重复地、相互独立地进行的一种随机试验,其特点是该随机试验…

伽马分布与 贝塔分布

伽马函数 称 为伽马函数,其中参数 ,伽马函数具有如下性质: ,n为自然数;或写作 余元公式:对于 ,有 与贝塔函数 的关系 : 对于 ;伽马函数是严格凹函数。x足够大时,可以用Stirling 公式来计算Gam…

贝塔、伽马分布

最近开始自学PRML,为此又补了概率论中的一些知识点。 相较于古典概率通过各种估计手段来确定参数的分布,贝叶斯学派则是使用后验概率来确定,为了方便计算后验概率,引入共轭先验分布来方便计算,这是后话了。 那么一些…

贝塔分布

B e t a Beta Beta分布 众所周知,当一个随机变量 Y Y Y的密度函数如下所示时,称这个变量 Y Y Y满足 B e t a ( a , b ) Beta(a,b) Beta(a,b)分布: f ( y ) y a − 1 ( 1 − y ) b − 1 ∫ 0 1 y a − 1 ( 1 − y ) b − 1 d y y a − 1 (…

数据科学分布——Beta分布

Beta分布 概念参数影响数量比例 随机产生数据概率密度函数累积概率密度函数 概念 贝塔分布(Beta Distribution) 是一个作为伯努利分布和二项式分布的共轭先验分布的密度函数,在机器学习和数理统计学中有重要应用。在概率论中,贝塔分布&#…

Beta分布及其应用

贝塔分布(Beta Distribution)是一个连续的概率分布,它只有两个参数。它最重要的应用是为某项实验的成功概率建模。在本篇博客中,我们使用Beta分布作为描述。 原文地址:http://www.datalearner.com/blog/1051505532393…

机器学习中的数学——常用概率分布(十):贝塔分布(Beta分布)

分类目录:《机器学习中的数学》总目录 相关文章: 常用概率分布(一):伯努利分布(Bernoulli分布) 常用概率分布(二):范畴分布(Multinoulli分布&am…

NLPIR分词系统的使用

前身是2000年发布的ICTCLAS,2009年更为现名。张华平博士打造。 Java课设做自动问答系统,用到了,所以记录一下使用方法,网上方法可能有点老,所以自己发现没有那么复杂。 https://github.com/NLPIR-team/NLPIR 上下载源…

分词系统

ICTClAS分词系统是由中科院计算所的张华平、刘群所开发的一套获得广泛好评的分词系统,难能可贵的是该版的Free版开放了源代码,为我们很多初学者提供了宝贵的学习材料。 但有一点不完美的是,该源代码没有配套的文档,阅读起来可能有…