Beta分布可以用于拟合各种不同的分布,网上各种资料对于Beta分布的原理着墨较多,却少有推导Beta分布公式的,所以,推导Beta分布公式如下:
设一组随机变量 ,将这n个随机变量排序后得到顺序统计量
,计算
落在区间
的概率,即求概率值
。将区间[0,1]分为三段
,
,
。考虑简单情形,假设n个数中只有一个落在了区间
内。因为样本
是第i大的,则
中应该有i-1个数,
这个区间中应该有n-k个数。先考虑一个符合上述条件的事件E。
则有:
考虑较为复杂的情形,假设n个数中有两个数落在了区间 ,
则有:
从以上分析可以看出,只要落在 内的数字超过一个,则对应事件的概率就是
,于是:
所以,可以得到 的概率密度函数为:
利用Gamma函数,可以把 表达为
取 ,
,于是得到:
此即为标准Beta分布的概率密度函数。更为一般的 分布概率密度函数为:
=
式中:
,
称 服从贝塔分布,简记为
。
形状参数 的表达式为:
式中, 为
的均值,
为
的方差。
通过 和
控制Beta分布概率密度函数的形状,可以模拟均匀分布到近似高斯分布等各种分布。
得到一组样本数据后,通过调整eta分布的形状参数 可以对样本数据进行拟合,通常,可以利用最小二乘法计算形状参数
。