Beta 分布

article/2025/10/15 16:52:58

在这里插入图片描述

Beta 函数

B ( α , β ) ≜ ∫ 0 1 x α − 1 ( 1 − x ) β − 1 d x \Beta(\alpha, \beta) \triangleq \int_0^1 x^{\alpha-1}(1-x)^{\beta-1}dx B(α,β)01xα1(1x)β1dx
其中 α , β > 0 \alpha, \beta > 0 α,β>0

Beta 函数与 Gamma 函数

B ( α , β ) = Γ ( α ) Γ ( β ) Γ ( α + β ) \Beta(\alpha, \beta) = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)} B(α,β)=Γ(α+β)Γ(α)Γ(β)
α , β ∈ N + \alpha,\beta\in N^+ α,βN+ 时,
B ( α , β ) = ( α − 1 ) ! ( β − 1 ) ! ( α + β − 1 ) ! \Beta(\alpha, \beta) = \frac{(\alpha-1)!(\beta-1)!}{(\alpha+\beta-1)!} B(α,β)=(α+β1)!(α1)!(β1)!

Beta 分布

f ( x ; α , β ) ≜ 1 B ( α , β ) x α − 1 ( 1 − x ) β − 1 f(x;\alpha, \beta) \triangleq \frac{1}{\Beta(\alpha, \beta)} x^{\alpha-1}(1-x)^{\beta-1} f(x;α,β)B(α,β)1xα1(1x)β1
为定义在 [ 0 , 1 ] [0,1] [0,1]上的 Beta分布 的概率密度函数,显然
∫ 0 1 f ( x ; α , β ) d x = 1 \int_0^1 f(x;\alpha, \beta) dx = 1 01f(x;α,β)dx=1

Beta 分布的期望

∫ 0 1 x f ( x ; α , β ) d x = ∫ 0 1 1 B ( α , β ) x α ( 1 − x ) β − 1 d x = 1 B ( α , β ) ∫ 0 1 x α + 1 − 1 ( 1 − x ) β − 1 d x = B ( α + 1 , β ) B ( α , β ) = Γ ( α + 1 ) Γ ( β ) Γ ( α + 1 + β ) Γ ( α + β ) Γ ( α ) Γ ( β ) = α α + β \begin{aligned} \int_0^1 xf(x;\alpha, \beta) dx &=\int_0^1 \frac{1}{\Beta(\alpha, \beta)} x^{\alpha}(1-x)^{\beta-1}dx \\\\ &=\frac{1}{\Beta(\alpha, \beta)} \int_0^1 x^{\alpha+1-1}(1-x)^{\beta-1}dx \\\\ &=\frac{\Beta(\alpha+1, \beta)}{\Beta(\alpha, \beta)} \\\\ &= \frac{\Gamma(\alpha+1)\Gamma(\beta)}{\Gamma(\alpha+1+\beta)}\frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)} \\\\ &= \frac{\alpha}{\alpha+\beta} \end{aligned} 01xf(x;α,β)dx=01B(α,β)1xα(1x)β1dx=B(α,β)101xα+11(1x)β1dx=B(α,β)B(α+1,β)=Γ(α+1+β)Γ(α+1)Γ(β)Γ(α)Γ(β)Γ(α+β)=α+βα

Beta-Binomial 共轭

假定二项分布 B ( n , p ) B(n, p) B(n,p) 的参数 p p p 服从 B e t a ( p ; α , β ) Beta(p;\alpha,\beta) Beta(p;α,β) 先验分布
p ∼ B e t a ( p ; α , β ) = 1 B ( α , β ) p α − 1 ( 1 − p ) β − 1 p \sim Beta(p;\alpha,\beta) = \frac{1}{\Beta(\alpha, \beta)} p^{\alpha-1}(1-p)^{\beta-1} pBeta(p;α,β)=B(α,β)1pα1(1p)β1
然后又做了 n 1 + n 2 n_1 + n_2 n1+n2 次伯努利实验(记为 W W W),成功 n 1 n_1 n1 次,失败 n 2 n_2 n2 次,于是后验分布为
P ( p ∣ W ) = P ( p , W ) P ( W ) = P ( W ∣ p ) P ( p ) ∫ 0 1 P ( W ∣ p ) P ( p ) d p = ( n 1 + n 2 n 1 ) p n 1 ( 1 − p ) n 2 1 B ( α , β ) p α − 1 ( 1 − p ) β − 1 ∫ 0 1 ( n 1 + n 2 n 1 ) p n 1 ( 1 − p ) n 2 1 B ( α , β ) p α − 1 ( 1 − p ) β − 1 d p = p n 1 + α − 1 ( 1 − p ) n 2 + β − 1 ∫ 0 1 p n 1 + α − 1 ( 1 − p ) n 2 + β − 1 d p = p n 1 + α − 1 ( 1 − p ) n 2 + β − 1 B ( n 1 + α , n 2 + β ) \begin{aligned} P(p|W) &= \frac{P(p,W)}{P(W)} \\\\ &= \frac{P(W|p)P(p)}{\int_0^1P(W|p)P(p)dp} \\\\ &= \frac{\dbinom{n_1+n_2}{n_1}p^{n_1}(1-p)^{n_2} \frac{1}{\Beta(\alpha, \beta)} p^{\alpha-1}(1-p)^{\beta-1}}{\int_0^1\dbinom{n_1+n_2}{n_1}p^{n_1}(1-p)^{n_2}\frac{1}{\Beta(\alpha, \beta)} p^{\alpha-1}(1-p)^{\beta-1}dp} \\\\ &= \frac{ p^{n_1+\alpha-1}(1-p)^{n_2+\beta-1}}{\int_0^1 p^{n_1+\alpha-1}(1-p)^{n_2+\beta-1}dp} \\\\ &= \frac{ p^{n_1+\alpha-1}(1-p)^{n_2+\beta-1}}{\Beta(n_1+\alpha, n_2 + \beta)} \\\\ \end{aligned} P(pW)=P(W)P(p,W)=01P(Wp)P(p)dpP(Wp)P(p)=01(n1n1+n2)pn1(1p)n2B(α,β)1pα1(1p)β1dp(n1n1+n2)pn1(1p)n2B(α,β)1pα1(1p)β1=01pn1+α1(1p)n2+β1dppn1+α1(1p)n2+β1=B(n1+α,n2+β)pn1+α1(1p)n2+β1即服从 B e t a ( n 1 + α , n 2 + β ) Beta(n_1+\alpha, n_2 + \beta) Beta(n1+α,n2+β) 分布!

简而言之:
B e t a ( α , β ) + B i n o m C o u n t ( n 1 , n 2 ) = B e t a ( n 1 + α , n 2 + β ) Beta(\alpha, \beta) + BinomCount(n_1, n_2) = Beta(n_1+\alpha, n_2 + \beta) Beta(α,β)+BinomCount(n1n2)=Beta(n1+α,n2+β)

在这里插入图片描述
Beta 分布是二项分布的共轭先验, α \alpha α β \beta β 可以分别看成伯努利试验中成功和失败的次数,而 B e t a ( p ; α , β ) Beta(p;\alpha, \beta) Beta(p;α,β)就是对伯努利试验中成功概率 p p p 的概率密度函数。

上图中的蓝色虚线对应 p = 0.25 p = 0.25 p=0.25,是 Beta(2,6) 和 Beta(10,30) 的期望值,即:
0.25 = 2 2 + 6 = 10 10 + 30 0.25 = \frac{2}{2+6} = \frac{10}{10+30} 0.25=2+62=10+3010
但是可以明显看出 Beta(10,30) 的概率密度曲线要比 Beta(2,6)更尖锐,说明当实验次数越多时,对 p = 0.25 p = 0.25 p=0.25 的信念越强!

在这里插入图片描述


http://chatgpt.dhexx.cn/article/RWLItac0.shtml

相关文章

如何理解beta分布?

相信大家学过统计学的都对 正态分布 二项分布 均匀分布 等等很熟悉了,但是却鲜少有人去介绍beta分布的。 用一句话来说,beta分布可以看作一个概率的概率分布,当你不知道一个东西的具体概率是多少时,它可以给出了所有概率出现的可…

原创 | 一文读懂正态分布与贝塔分布

本文约2300字,建议阅读5分钟 本文通过案例介绍了正态分布和贝塔分布的概念。 正态分布 正态分布,是一种非常常见的连续概率分布,其也叫做常态分布(normal distribution),或者根据其前期的研究贡献者之一高斯的名字来称…

带你理解beta分布

#beta分布介绍 相信大家学过统计学的都对 正态分布 二项分布 均匀分布 等等很熟悉了,但是却鲜少有人去介绍beta分布的。 用一句话来说,beta分布可以看作一个概率的概率分布,当你不知道一个东西的具体概率是多少时,它可以给出了所…

深入理解什么是Beta分布

例一 Beta分布是一种描述概率的概率分布,这句话可能有些绕口,看一个例子: 以抛硬币为例,如果硬币是均匀的,并且正面朝上的概率记为p(p0.5),那么每一次抛硬币都可以看做是一次伯努利…

贝塔分布(beta分布)及Python实现——计算机视觉修炼之路(二)

beta分布 贝塔分布( Beta Distribution ) 是一个作为伯努利分布和二项式分布的共轭先验分布的密度函数,在机器学习和数理统计学中有重要应用。在概率论中,贝塔分布,是指一组定义在(0,1)区间的连续概率分布。其概率密度函数为&…

Beta分布(概率的概率)

目录 1.前言 2.定义 3.Beat分布的概率密度函数(PDF): 4.Beat分布的累积密度函数(CDF): 1.前言 伯努利试验(同样的条件下重复地、相互独立地进行的一种随机试验,其特点是该随机试验…

伽马分布与 贝塔分布

伽马函数 称 为伽马函数,其中参数 ,伽马函数具有如下性质: ,n为自然数;或写作 余元公式:对于 ,有 与贝塔函数 的关系 : 对于 ;伽马函数是严格凹函数。x足够大时,可以用Stirling 公式来计算Gam…

贝塔、伽马分布

最近开始自学PRML,为此又补了概率论中的一些知识点。 相较于古典概率通过各种估计手段来确定参数的分布,贝叶斯学派则是使用后验概率来确定,为了方便计算后验概率,引入共轭先验分布来方便计算,这是后话了。 那么一些…

贝塔分布

B e t a Beta Beta分布 众所周知,当一个随机变量 Y Y Y的密度函数如下所示时,称这个变量 Y Y Y满足 B e t a ( a , b ) Beta(a,b) Beta(a,b)分布: f ( y ) y a − 1 ( 1 − y ) b − 1 ∫ 0 1 y a − 1 ( 1 − y ) b − 1 d y y a − 1 (…

数据科学分布——Beta分布

Beta分布 概念参数影响数量比例 随机产生数据概率密度函数累积概率密度函数 概念 贝塔分布(Beta Distribution) 是一个作为伯努利分布和二项式分布的共轭先验分布的密度函数,在机器学习和数理统计学中有重要应用。在概率论中,贝塔分布&#…

Beta分布及其应用

贝塔分布(Beta Distribution)是一个连续的概率分布,它只有两个参数。它最重要的应用是为某项实验的成功概率建模。在本篇博客中,我们使用Beta分布作为描述。 原文地址:http://www.datalearner.com/blog/1051505532393…

机器学习中的数学——常用概率分布(十):贝塔分布(Beta分布)

分类目录:《机器学习中的数学》总目录 相关文章: 常用概率分布(一):伯努利分布(Bernoulli分布) 常用概率分布(二):范畴分布(Multinoulli分布&am…

NLPIR分词系统的使用

前身是2000年发布的ICTCLAS,2009年更为现名。张华平博士打造。 Java课设做自动问答系统,用到了,所以记录一下使用方法,网上方法可能有点老,所以自己发现没有那么复杂。 https://github.com/NLPIR-team/NLPIR 上下载源…

分词系统

ICTClAS分词系统是由中科院计算所的张华平、刘群所开发的一套获得广泛好评的分词系统,难能可贵的是该版的Free版开放了源代码,为我们很多初学者提供了宝贵的学习材料。 但有一点不完美的是,该源代码没有配套的文档,阅读起来可能有…

中科院分词ICTCLAS汉语分词系统简单配置

汉语分词一直来说都是进行文本分析的瓶颈,这里介绍一个汉语分词系统ICTCLAS,全球很受欢迎的汉语分词开源系统,曾获得首界国际分词大赛综合排名第一,国家973评测第一名;支持词典,多级词性标注,支…

智能语言-中科院分词系统ICTCLAS(NLPIR)

智能语言的处理中,第一个步骤就是分词。一个句子处理的第一步就是分词了,目前而言中文分词中效果最好的就是中科院分词系统。在2014版本以及之前称为ICTCLAS,之后的版本都更名为NLPIR。 我给出一个最简单的使用教程,能够帮助新手…

NLPIR(北理工张华平版中文分词系统)的SDK(C++)调用方法

一、本文内容简介 关于中文分词的基本概念关于NLPIR(北理工张华平版中文分词系统)的基本情况具体SDK模块(C版)的组装方法 二、具体内容 1. 中文分词的基本概念 中文分词是自然语言处理的一个分支,自然语言即人们在日常生活中使用的语言,包含书面语,口…

哈工大中文分词系统LTP(pyltp)学习笔记

一、LTP简介 介绍:语言技术平台(LTP) 提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富、高效、精准的自然语言处理技术。经过 哈工大社会计算与信息检索研究中心 11 年的持续研发和推广,LTP已经成为国内外最具影响力的中文…

比较热门好用的开源中文分词软件系统有哪些?

在逐渐步入DT(Data Technology)时代的今天,自然语义分析技术越发不可或缺。对于我们每天打交道的中文来说,并没有类似英文空格的边界标志。而理解句子所包含的词语,则是理解汉语语句的第一步。汉语自动分词的任务&…

中科院分词系统整理笔记

NLPIR简介 一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处理加工工具。可以使用该软件对自己的数据进行处理。 NLPIR分词系统前身为2000年发布的ICTCLAS词法分析系统,从2009年开始&…