机器学习小组知识点12:超几何分布(Hyper-Geometric Distribution)

article/2025/9/18 0:13:47

超几何分布与二项分布的联系与区别

事实上,超几何分布和二项分布确实有着密切的联系,但也有明显的区别。
  课本对于超几何分布的定义是这样的:一般的,若一个随机变量X的分布列为,其中,则称X服从超几何分布,记为。其概率分布表为:
     
  对于二项分布的定义是这样的:若随机变量X的分布列为,其中则称X服从参数为n,p的二项分布,记为。其概率分布表为:
    
  超几何分布与二项分布都是取非负整数值的离散分布,表面上看,两种分布的概率求取有截然不同的表达式,但看它们的概率分布表,会发现构造上的相似点,如:随机变量X的取值都从0连续变化到l,对应概率和N,n,l三个值密切相关……可见两种分布之间有着密切的联系。对超几何分布的模型建立是这样的:若有N件产品,其中M件是废品,无返回地任意抽取n件,则其中恰有的废品件数X是服从超几何分布的。而对二项分布则使用比较容易理解的射击问题来建立模型。若将但超几何分布的概率模型改成:若有N件产品,其中M件是废品,有返回的任意抽取n件,则其中恰有的废品件数X是服从二项分布的。在这里,两种分布的差别就在于""""的差别,只要将概率模型中的""改为"",或将""改为"",就可以实现两种分布之间的转化。"返回""不返回"就是两种分布转换的关键。
  看例题:高三(1)班的联欢会上设计了一项游戏:在一个口袋中装有10个红球、20个白球,这些球除颜色外完全相同,一次从中摸出5个球,摸到4个红球1个白球就是一等奖,求获一等奖的概率。本题采用的解法是摸出球中的红球个数X服从超几何分布,但是如果将"一次从中摸出5个球"改为"摸出一球记下颜色,放回后再摸一球,反复5",则摸出球中的红球个数X将不再服从超几何分布,而是服从二项分布。
  我们分别来计算两种分布所对应的概率:

       
  这时发现发现两种不同的分布其对应的概率之间的差距进一步缩小了,我们做出这样的猜想:样本个数越大超几何分布和二项分布的对应概率相差就越小,当样本个数为无穷大时,超几何分布和二项分布的对应概率就相等,换而言之超几何分布的极限就是二项分布!也就是说。下面我们对以上猜想作出证明:
  产品个数N无限大,设废品率为p,则

       
  
  以上的证明与我们的直观思想相吻合:在废品为确定数M的足够多的产品中,任意抽取n个(由于产品个数N无限多,无返回与有返回无区别,故可看作n次独立试验)中含有k个废品的概率当然服从二项分布。在这里,超几何分布转化为二项分布的条件是(1)产品个数应无限多,否则无返回地抽取n件产品是不能看作n次独立试验的.(2)在产品个数N无限增加的过程中,废品数应按相应的"比例"增大,否则上述事实也是不成立的。
  对于超几何分布的数学期望,二项分布的数学期望,当我们将"不返回"改为"返回"时,,两种分布的数学期望相等,方差之间没有相等关系。超几何分布和二项分布的数学期望和方差是否也具有我们以上猜想并证明的极限关系呢?
  事实上超几何分布的数学期望,方差这两个极限值分别是二项分布的数学期望与方差。需要指明的是这一性质并非只为超几何分布与二项分布之间所具有,一般地,如果随机变量依分布收敛于随机变量,则随机变量的数学期望和方差分别是随机变量的数学期望和方差的极限。这样超几何分布与二项分布达到了统一。
  一般说来,有返回抽样与无返回抽样计算的概率是不同的,特别在抽取对象数目不大时更是如此。但当被抽取的对象数目较大时,有返回抽样与无返回抽样所计算的概率相差不大,人们在实际工作中常利用这一点,把抽取对象数量较大时的无返回抽样(例如破坏性试验发射炮弹;产品的寿命试验等),当作有返回来处理。
  那么,除了在有无"返回"上做文章,有没有什么办法快速实现超几何分布向二项分布的转化呢?
  设想N件产品装在一个大袋中,其中M件为废品,无返回地从中抽取n件,那么其中废品件数 X服从超几何分布。现若在大袋中再放进两个小袋,一袋装正品,一袋装废品,然后从大袋中任摸一个小袋,无返回地从中任取一件产品,则这样任取n件,其中废品件数X就不再服从超几何分布,而应服从的二项分布了。事实上,我们把摸到正品袋中的产品看作"成功",摸到废品袋中的产品看作"失败",则"成功""失败"的概率相等,皆为且每次试验是相互独立的,正是典型的伯努力试验概型,因此可用二项分布去刻划其概率分布列。,从这一点上讲,两种分布仅"一袋之隔"。将正品和废品隔离,则超几何分布将成为二项分布。
  超几何分布和二项分布这两种离散型随机变量的概率分布表面上看来风马牛不相及,但通过以上的论证,我们发现这两种分布可以通过有无"返回",隔离正品和次品等方法来互相转换,抛开转换问题,也可把二项分布看作超几何分布的极限,它们的期望和方差之间也存在这种极限关系。


http://chatgpt.dhexx.cn/article/XHAO5Rmb.shtml

相关文章

常见分布总结-高斯分布、伯努利分布、泊松分布、几何分布、beta分布

概率分布 概率分布是指用于表述随机变量取值的概率规律,包括连续分布和离散分布。 下面作了这些概率分布的一个思维导图。 文章目录 概率分布1、离散概率分布1.1、两点分布2.2、 二项分布1.3、几何分布1.4、超几何分布1.5、泊松分布2、连续概率分布2.1、均匀分布2.2、正太分布…

超几何分布的其他形式及其解释?

超几何分布定义 百度百科:超几何分布是统计学上一种离散概率分布。它描述了从有限N个物件(其中包含M个指定种类的物件)中抽出n个物件,成功抽出该指定种类的物件的次数(不放回)。称为超几何分布,…

geometric distribution and exponential distribution(几何分布和指数分布)

几何分布 分布函数均值和方差意义 表示经过k次实验才第一次得到正确的实验结果 比如抛硬币得到正面的需要抛的次数 指数分布 分布函数均值和方差意义 表示经过一段x之后,某件事第一次发生 比如经过x时间之后,公交车来的概率 比如餐厅从开业到第一个客人…

概率论的学习和整理9:超几何分布 (未完成!!!)

目录 1超几何分布 Hypergeometric distribution 1.1 超几何分布的定义 1.2 为什么叫超几何分布 1.3 超几何分布的公式 (2种公式) 1.3.1 超几何分布的公式1 (总体型公式) 1.3.2 超几何分布的公式2 (拆…

概率论与数理统计基础(二):常用离散分布 二项、泊松、超几何分、几何、 负二项分布

本文列举了常见的离散分布,关于它们的背景、概率分布列、数学期望与方差,以及与之相关的一些重要性质;比如几何分布的无记忆性、 二项分布的泊松近似、超几何分布的二项近似。。。。可作为离散分布的知识速查表。 目录 1. 二项分布b(n,p) …

如何理解几何分布与指数分布的无记忆性?

在经济学上,有一个概念是沉没成本,大概指的是已经付出的、且不可收回的成本。针对这个概念有一个常见的说法: 这句话的意思是,既然沉没成本不可收回,那么在做选择的时候就不应该考虑它。举一个简单的例子,买…

几何分布的期望公式的推导

随机变量服从几何分布 概率分布 期望 现在先求等差比数列和 ②-③, 并运用等比数列求和公式,可得 将④代入①得

统计学:几何分布、二项分布、泊松分布

一、几何分布 假设某种赌博游戏的胜率为0.2,那么意味着你玩第一次就胜出的概率为0.2。 那玩第二次才胜出呢?“玩第二次才胜出”就意味着玩第一次是失败的,而直到第二次才胜出,那么这件事发生的概率就是0.80.20.16。 那么第三次…

统计学 分布篇 - Hypergeometric Distribution(超几何分布)

超几何分布: 是 离散随机分布的一种. 它描述的是 从 n 中 拿 k 个成功的事件的概率( 不放回, 不放回意味着该事件是非独立事件), 其中在 N 中一共有 K 个成功事件. n 为 样本数量, k 为样本中成功的概率 N为 事件的总数量(population), K为 在N中 事件的总数量. note: 超几…

几何分布的期望与方差

几何分布的期望与方差 高中数学教科书新版第三册(选修II)比原来的修订本新增加随机变量的几何分布,但书中只给出了结论:(1),(2),而未加以证明。本文给出证明&…

概率统计14——几何分布

我家小朋友年方1岁半,家里每天上午都要出去遛小孩。现在小朋友有两项爱好,在家翻垃圾桶,出门捡烟头。 翻垃圾桶可以有效地限制,捡烟头可是防不胜防。 也许烟头能散发出特殊的能量波动,小区的绿化带和草坪上的大部分烟…

超几何分布定义

设有N件产品,其中有M(M≤N)件是不合格品.若从中不放回地抽取n(n≤N)件,设其中含有的不合格品的件数为X,则X的分布律为 称X服从参数为N、M和n的超几何分布,记为X~H&#x…

几何分布和二项分布有什么区别?

● 每周一言 越长大越渺小。 导语 各种常见的分布中,二项分布和几何分布经常同时出现,在前面讲泊松分布的时候也简单提到了二项分布。那么,几何分布是什么分布?和二项分布有什么区别? 几何分布 讲泊松分布的时候提…

几何分布定义

在伯努利试验中&#xff0c;记每次试验中A事件发生的概率P&#xff08;A&#xff09;p&#xff08;0<p<1&#xff09;&#xff0c;设随机变量X表示A事件首次出现时已经试验的次数&#xff0c;则X的取值为1&#xff0c;2&#xff0c;…&#xff0c;n&#xff0c;…&#x…

几何分布GeometricDistribution

几何分布 几何分布用于描述这种分布&#xff1a;独立事件的结果只有2个&#xff1a;”1和0“ 或”成功和失败“等&#xff0c;成功的概率为 p p p, 失败的概率为 q 1 − p q1-p q1−p; 第r次成功的概率为 P ( X r ) p ⋅ q r − 1 P(Xr)p\cdot q^{r-1} P(Xr)p⋅qr−1 即用…

MCS:离散随机变量——几何分布

Geometric 几何分布&#xff08;Geometric distribution&#xff09;是离散型概率分布。其中一种定义为&#xff1a;在 n n n次伯努利试验中&#xff0c;试验 k k k次才得到第一次成功的机率。详细地说&#xff0c;是&#xff1a;前 k − 1 k-1 k−1次皆失败&#xff0c;第 k …

概率论的学习和整理8: 几何分布

目录 前言 1 什么是几何分布 1.1 常规定义 1.2 另外一种定义 2 几何分布在概率分布中的定位 3 几何分布的 概率&#xff0c;期望&#xff0c;方差 4 为什么叫几何分布 &#xff08;几何等比&#xff09; 4.1 先需要了解算术平均数和几何平均数 4.2 第1&#xff1a;几…

几何分布(一种离散分布)

几何分布 几何分布是伯努利分布的推广&#xff0c;不断重复伯努利试验&#xff0c;直到首次成功为止&#xff0c;随机变量 X X X表示首次成功时已经完成的试验次数&#xff0c;我们称 X X X 是一个服从几何分布的随机变量 适用情况举例 实际中有不少随机变量服从几何分布&…

离散型概率分布之二——几何分布

上一篇博客讲了一下二项分布&#xff0c;这一篇打算讲一下几何分布。 其实&#xff0c;几何分布跟二项分布极为相似&#xff0c;至于相似到了什么地步&#xff0c;话不多说&#xff0c;往下看您就知道了。 由于是同系列的博客&#xff0c;所以用同样的思路来讲。 首先&#x…

视频教程-清华-尹成老师-Python爬虫day48-Python

清华-尹成老师-Python爬虫day48 毕业于清华大学&#xff0c;曾担任Google算法工程师&#xff0c;微软人工智能领域全球最具价值专家&#xff0c;微软Tech Ed 大会金牌讲师。 精通C/ C&#xff0c;Python ,Go语言,Sicikit-Learn与TensorFlow拥有15年编程经验与5年的教学经验&…