概率论3——古典概型与二项分布

article/2025/10/18 20:58:22

排列组合

排列组合高中应该就学过,包括两个原理(加法和乘法原理),以及排列和组合

两个原理

加法原理
比如完成某件事有3类途径,在1类中有4种方法,第2类中有2种方法,第3类中有3种方法,那么完成这件事有4+2+3种不同的方法:
在这里插入图片描述

完成某件事需要n个步骤,每个步骤之间有关联(不独立),第一个步骤有m种方法,而对应于第一个步的第k个方法,第二个步骤有 m k m_k mk种方法,那么完成这件事共有 ∑ k = 1 m m k \sum_{k=1}^mm_k k=1mmk种方法

乘法原理
比如完成某件事需要2个步骤,第一个步骤有3种方法,第二个步骤有2种方法,那么完成这件事共有3x2种方法:
在这里插入图片描述

完成某件事需要n个步骤,每个步骤之间没有关联(独立),第k个步骤有 m k m_k mk种方法,那么完成这件事共有 ∏ k = 1 n m k \prod_{k=1}^nm_k k=1nmk种方法


可以将仅有2个步骤的乘法原理过程看成1个特殊的加法原理过程,其特殊在于第一个步的第k个方法,第二个步骤有 m k m_k mk种方法,并且对于任意 m k m_k mk都相等。
在这里插入图片描述

排列与组合

从n个不同元素中取出r个,排成一排,称为一个排列,亦称为有序抽样

若取出r个元素不允许重复(不放回抽样),由乘法原理可知排列方式有 A n r A_n^r Anr种:
A n r = n ( n − 1 ) . . . ( n − r + 1 ) = n ! ( n − r ) ! A_n^r=n(n-1)...(n-r+1)=\cfrac{n!}{(n-r)!} Anr=n(n1)...(nr+1)=(nr)!n!
r < n r<n r<n时为选排列,当 r = n r=n r=n时为全排列,且 A n n = n ! A_n^n=n! Ann=n!


若取出r个元素允许重复(有放回抽样),由乘法原理可知排列方式有 n r n^r nr

从n个不同元素中取出r个,作为一组,称为一个组合,亦称为无序抽样

可以将其看成一个无序排列,取出r个的排列总数除以每个排列可交换顺序次数。
若取出r个元素不允许重复(不放回抽样),则组合数为:
C n r = A n r r ! = n ! r ! ( n − r ) ! C_n^r=\cfrac{A_n^r}{r!}=\cfrac{n!}{r!(n-r)!} Cnr=r!Anr=r!(nr)!n!
等式组合:
C n r = C n n − r C_n^r=C_n^{n-r} Cnr=Cnnr


若取出r个元素允许重复(有放回抽样),则可以采用拔靴法(Bootstrapping):
\qquad
假设集合 S = { w 1 , w 2 , w 3 } S=\{w_1,w_2,w_3\} S={w1,w2,w3},有放回无序抽样 r = 2 r=2 r=2个,共有多少种结果 ?(求全集数量)
( 注,下列结果中“,”不用来表示先后顺序,B表示计数桶,当 B = ( x 1 , x 2 , x 3 ) B=(x_1,x_2,x_3) B=(x1x2x3)时表示 w 1 w_1 w1个数为 x 1 x_1 x1 w 2 w_2 w2个数为 x 2 x_2 x2 w 3 w_3 w3个数为 x 3 x_3 x3。)
\qquad
1、 B = ( 2 , 0 , 0 ) B=(2,0,0) B=(200) → \to\qquad { w 1 , w 1 } \{w_1,w_1\}\qquad {w1,w1} 2、 B = ( 0 , 2 , 0 ) B=(0,2,0) B=(020) → \to\qquad { w 2 , w 2 } \{w_2,w_2\} {w2,w2}
3、 B = ( 0 , 0 , 2 ) B=(0,0,2) B=(002) → \to\qquad { w 3 , w 3 } \{w_3,w_3\}\qquad {w3,w3} 4、 B = ( 1 , 1 , 0 ) B=(1,1,0) B=(110) → \to\qquad { w 1 , w 2 } \{w_1,w_2\} {w1,w2}
5、 B = ( 1 , 0 , 1 ) B=(1,0,1) B=(101) → \to\qquad { w 1 , w 3 } \{w_1,w_3\}\qquad {w1,w3} 6、 B = ( 0 , 1 , 1 ) B=(0,1,1) B=(011) → \to\qquad { w 2 , w 3 } \{w_2,w_3\} {w2,w3}
\qquad
我们将上面所有结果用如下方程来表示,在 B = ( x 1 , x 2 , x 3 ) B=(x_1,x_2,x_3) B=(x1x2x3)中有 :
\qquad
x 1 + x 2 + x 3 = 2 , 其 中 x 1 , x 2 , x 3 ∈ { 0 , 1 , 2 } \qquad x_1+x_2+x_3=2,\quad其中x_1,x_2,x_3\in\{0,1,2\} x1+x2+x3=2x1x2x3{0,1,2}
\qquad
将上述情况推广一下,对于集合 S = { w 1 , w 2 . . . . , w n } S=\{w_1,w_2....,w_n\} S={w1,w2....,wn},有放回无序抽样 r r r个,结果即为:
\qquad
x 1 + x 2 . . . + x n = r , 其 中 任 意 x i ∈ { 0 , 1... , r } \qquad x_1+x_2...+x_n=r,\quad其中任意x_i\in\{0,1...,r\} x1+x2...+xn=rxi{0,1...,r}
\qquad
但是上述结果是不易求解的,我们将问题转化一下,我们重新用一个桶,编号0~n,分别用来存放抽取出来的杆 w i w_i wi
在这里插入图片描述
我们再简化一下,把桶也去了,只留下分隔栏:
在这里插入图片描述
所以栏的数+杆 w i w_i wi的数一共有 n + r − 1 n+r-1 n+r1个,我们现在有 n + r − 1 n+r-1 n+r1个孔:
在这里插入图片描述
我们现在要做的,要么先将 r r r根杆先插入 n + r − 1 n+r-1 n+r1个孔中,然后用剩下n-1根栏按顺序依次插入空白的孔中。由于只要 r r r根杆位置确定了,栏的位置也就确定了。
要么先将 n − 1 n-1 n1n-1根栏先插入 n + r − 1 n+r-1 n+r1个孔中,然后用剩下r根杆按顺序依次插入空白的孔中。由于只要 n − 1 n-1 n1根栏位置确定了,杆的位置也就确定了。
\qquad
所以有组合数为:
C n + r − 1 r = A n + r − 1 r r ! = ( n + r − 1 ) ! r ! ( ( n + r − 1 ) − r ) ! = ( n + r − 1 ) ! r ! ( n − 1 ) ! = C n + r − 1 n − 1 C_{n+r-1}^r=\cfrac{A_{n+r-1}^r}{r!}=\cfrac{(n+r-1)!}{r!((n+r-1)-r)!}=\cfrac{(n+r-1)!}{r!(n-1)!}=C_{n+r-1}^{n-1} Cn+r1r=r!An+r1r=r!((n+r1)r)!(n+r1)!=r!(n1)!(n+r1)!=Cn+r1n1

在这里插入图片描述

古典概型

古典概型又称为等可能概型,特点如下:

1、基本事件有限
2、基本事件互斥
3、基本事件等可能发生

定义条件:

1、 Ω = { w 1 , w 2 . . . . . w n } , n ≠ ∞ . n = C \Omega= \{w_1,w_2.....w_n\},n\neq \infty.n=C Ω={w1,w2.....wn},n=.n=C
2、 w i ∩ w j = ∅ , i ≠ j w_i \cap w_j=\varnothing,i\neq j wiwj=,i=j
3、 P ( w 1 ) = P ( w 2 ) = P ( w 3 ) . . . = P ( w n ) P(w_1)=P(w_2)=P(w_3)...=P(w_n) P(w1)=P(w2)=P(w3)...=P(wn)
4、 P ( Ω ) = 1 P(\Omega)=1 P(Ω)=1

性质:

A = { w 1 , w 2 . . . . . w m } A= \{w_1,w_2.....w_m\} A={w1,w2.....wm}
P ( A ) = P ( w 2 ) + P ( w 3 ) . . . + P ( w m ) = m n P(A)=P(w_2)+P(w_3)...+P(w_m)=\frac{m}{n} P(A)=P(w2)+P(w3)...+P(wm)=nm

放回抽样与不放回抽样

这个前面排列组合时已经讲过,这里就不再提及,排列组合中分为四种:

1、不放回有序采样 2、放回有序采样
3、不放回无序采样 4、放回无序采样
\qquad
但这四种抽样结果中,并不都属于古典概型,比如第四种,假设新集合 A A A为从 S = { w 1 , w 2 } S=\{w_1,w_2\} S={w1,w2},有放回无序抽取2个,很显然该集合 A A A所有元素为:
\qquad
A = { a 1 , a 2 , a 3 } A=\{a_1,a_2,a_3\} A={a1,a2,a3} \qquad a 1 = { w 1 , w 1 } , a 1 = { w 2 , w 2 } , a 3 = { w 1 , w 2 } a_1=\{w_1,w_1\},a_1=\{w_2,w_2\},a_3=\{w_1,w_2\} a1={w1,w1},a1={w2,w2},a3={w1,w2}
\qquad
但是 a 3 a_3 a3的概率和 a 1 、 a 2 a_1、a_2 a1a2的概率并不等,因为 a 3 a_3 a3的结果可以抽到是 ( w 1 , w 2 ) (w_1,w_2) (w1,w2)也可以是 ( w 2 , w 1 ) (w_2,w_1) (w2,w1),所以 P ( a 1 ) = P ( a 2 ) = 0.25 , P ( a 3 ) = 0.5 P(a_1)=P(a_2)=0.25,P(a_3)=0.5 P(a1)=P(a2)=0.25,P(a3)=0.5

随机抽样在机器学习中的应用

所以在机器学习中,我们从数据全集中抽取一部分样本进行训练时,采样时就要注意选择抽样方法,抽样结果是否和全集的数据分布特征一致,不一致时又如何处理。

n n n个样本的训练集的随机放回采样中,一个样本每次被采集到的概率是 1 n \frac{1}{n} n1。不被采集到的概率为 1 − 1 n 1- \frac{1}{n} 1n1。在连续n次采样都没有被采集中的概率是 ( 1 − 1 n ) n (1- \frac{1}{n})^n (1n1)n
\qquad
n → ∞ n→∞ n时, ( 1 − 1 n ) n = 1 e → 0.368 (1- \frac{1}{n})^n=\frac{1}{e}→0.368 (1n1)n=e10.368。也就是说,在bagging的每轮随机采样中,训练集中大约有 36.8 36.8% 36.8的数据没有被采样集采中。对于这部分大约36.8%的没有被采样到的数据,我们常常称之为袋外数据(Out Of Bag, 简称OOB)。这些数据没有参与训练集模型的拟合,因此可以用来检测模型的泛化能力。

几何分布

上面的抽样方式中,利用第四种放回无序的抽样,在对立事件的集合中,可以得到几何分布:

1、集合必须右对立事件构成,比如一个集合中,共有N件产品,且有K件次品,很显然剩下N-K件均为良品。
2、放回抽取r次,求恰好第r次才抽中次品的概率。
\qquad
由于每次抽取都是独立的,所以每次抽到次品概率为 K N \frac{K}{N} NK,良品概率 N − K N \frac{N-K}{N} NNK,由乘法原理我们知道连续抽取r次,前面都抽到了良品,所以根据乘法原理有:

\qquad
P ( r ) = ( 1 − p ) r − 1 p = ( N − K N ) r − 1 ( K N ) P(r)=(1-p)^{r-1}p=(\frac{N-K}{N})^{r-1}(\frac{K}{N}) P(r)=(1p)r1p=(NNK)r1(NK)

二项分布

上面的抽样方式中,利用第四种放回无序的抽样,在对立事件的集合中,可以得到二项分布:

1、集合必须右对立事件构成,比如一个集合中,共有N件产品,且有K件次品,很显然剩下N-K件均为良品。
2、放回抽取r次,且事件A为:r次抽取中,恰有m件次品。
在这里插入图片描述
求P(A)为多少?
\qquad
由于每次抽取都是独立的,所以每次抽到次品概率为 K N \frac{K}{N} NK,良品概率 N − K N \frac{N-K}{N} NNK,由乘法原理我们知道连续抽取r次,抽到任意特定情况(比如下图情况)的m件次品和(r-m)件良品的概率为: ( K N ) m ( N − K N ) r − m = K m ( N − K ) r − m N r (\frac{K}{N})^m(\frac{N-K}{N})^{r-m}=\frac{K^m(N-K)^{r-m}}{N^r} (NK)m(NNK)rm=NrKm(NK)rm
在这里插入图片描述
但由于要求是无序的,所以需要将所有可能的排列算进去,得:
P ( A ) = C r m p m ( 1 − p ) r − m = C r m ( K N ) m ( N − K N ) r − m = C r m K m ( N − K ) r − m N r P(A)=C_r^mp^m (1-p)^{r-m}=C_r^m (\frac{K}{N})^m (\frac{N-K}{N})^{r-m}=C_r^m\frac{K^m(N-K)^{r-m}}{N^r} P(A)=Crmpm(1p)rm=Crm(NK)m(NNK)rm=CrmNrKm(NK)rm

或者也可以理解为:从集合r次抽取构成一个新集合,其中恰有m件次品的样本比例为多少?
\qquad
新集合基本事件总数为 N r N^r Nr个,每次从 K K K件次品中取1件,取m次共有 K m K^m Km种取法,同理良品有
( N − K ) r − m (N-K)^{r-m} (NK)rm种取法,由于m件次品在r次抽样中的方式共有 C r m C_r^m Crm种,所以事件A发生的个数为 C r m K m ( N − K ) r − m C_r^mK^m(N-K)^{r-m} CrmKm(NK)rm,除以基本事件总数即可得到概率:
\qquad
P ( A ) = C r m K m ( N − K ) r − m N r P(A)=\frac{C_r^mK^m(N-K)^{r-m}}{N^r} P(A)=NrCrmKm(NK)rm
在这里插入图片描述

超几何分布

上面的抽样方式中,利用第三种不放回无序的抽样,在对立事件的集合中,可以得到超几何分布:

1、集合必须右对立事件构成,比如一个集合中,共有N件产品,且有K件次品,很显然剩下N-K件均为良品。
2、不放回抽取r次,且事件A为:r次抽取中,恰有m件次品。
在这里插入图片描述
从集合中取出r件产品作为新集合,新集合样本数为 C N r C_N^r CNr,在K件次品中取m件,有 C K m C_K^m CKm种取法,在N-K件次品中取r-m件,有 C N − K r − m C_{N-K}^{r-m} CNKrm种取法,所以概率为:

P ( A ) = C K m C N − K r − m C N r P(A)=\frac{C_K^mC_{N-K}^{r-m}}{C_N^r} P(A)=CNrCKmCNKrm
\qquad
在这里插入图片描述

几何概型

几何概型也是等可能概型,与古典概型的区别在于基本事件个数,特点如下:

1、基本事件无限
2、基本事件互斥
3、基本事件等可能发生

特征如下:

1、样本空间 S S S是一个几何区域,这区域大小可以度量,并记 S S S的度量为 m ( S ) m(S) m(S)
2、落在区域内任意点都是等可能的,落在其内的区域 A A A内的可能性与 m ( A ) m(A) m(A)成正比。
在这里插入图片描述
事件A发生的概率为:
\qquad
P ( A ) = m ( A ) m ( S ) P(A)=\frac{m(A)}{m(S)} P(A)=m(S)m(A)


http://chatgpt.dhexx.cn/article/4KvH5JtM.shtml

相关文章

概率论基础(1)古典和几何概型及事件运算

概率论对于学习 NLP 方向的人&#xff0c;重要性不言而喻。于是我打算从概率论基础篇开始复习&#xff0c;也顺便巩固巩固基础。 1.事件及运算 1.1 文森图及运算 1.2常用运算律 1.3相关练习 理解&#xff1a;要么A要么B要么C发生&#xff0c;所以是A ∪ B ∪ C&#xff…

概率论--古典概型和几何概型

-------------------------------------------几何概型------------------------------------------------------------------ 向某一可度量的区域内任掷一点.如果所掷的点落在中任意子区域内的可能性大小与&#xff21;的度量&#xff08;长度&#xff0c;面积和体积等&…

古典概型和几何概型

古典概型&#xff08;等可能概型&#xff09; 1.1定义&#xff08;随机试验模型&#xff09; ①只有有限个可能 ②每个结果发生的可能性大小相同。 由 1P(S)得 设事件A包含样本空间S中k个基本事件&#xff0c;那么事件A发生的概率为 1.2计算古典概型的方法——排列跟组合 …

古典概型-分房模型

古典概型问题一般从排列组合、乘法原理的角度思考&#xff1b; 回想概率的基本公式&#xff1a;p(A)A事件发生的次数/总的实验次数 &#xff08;1&#xff09;k个盒子已经指定了&#xff0c;每次拿一个球放入其中一个盒子 第一问可以理解为&#xff1a;指定的k个盒子中各有一球…

【概率论与数理统计】猴博士 笔记 p1-p2 古典概型、几何概型

视频 古典概型 常见的古典概型题目分为&#xff1a; 有放回无放回 有放回 对于有放回的题目&#xff0c;一般可以这样做&#xff1a; 举个例子&#xff0c;如题&#xff1a; 则它们的答案是&#xff1a; 1. C 4 4 ∗ &#xff08; 2 5 &#xff09; 4 C_{4}^{4} *&…

概率论 事件关系 古典概型与几何概型

基本知识点 随机试验:1.不确定性2.可预知性3.可重复性基本事件:包含一个样本点 必然事件:全集 不可能事件:空集 子集2^n-1-1(减去空集与真集) 事件间的关系 1.包含关系 2.和运算AUBAB,A与B至少有一个发生 3.积事件A∩BAB,AB同时发生 4.差事件A-BAB ̅A-AB,A发生但B不发生 5.…

概率论 1.3 古典概型与几何概型

1.3.1 排列与组合 排列 从n个不同元素任取r(r<n)个元素排成一列(考虑元素出现的先后次序)&#xff0c;称此为一个排列&#xff0c;此种排列的总数为n(n-1)....(n-r1)n!/(n-r)&#xff01;&#xff0c;若rn,则称为全排列&#xff0c; 2.重复排列 从n个不同元素中每次取出一个…

概率论基础 —— 1. 基本事件类型、运算规则,及古典概型与几何型概型

概率论与数理统计的相关知识&#xff0c;是机器学习及深度学习最常应用到的基本知识。因为对于机器学习和深度学习来说&#xff0c;最常见的一个应用场景就是训练一堆样本集后&#xff0c;给定一个测试样本&#xff0c;它可能同时具备类A和类B的特征&#xff0c;那么就需要通过…

概率论---古典概型

1、称具有下列两个特征的随机试验模型为古典概型&#xff1a; (1)随机试验具有有限个可能的结果&#xff1b;&#xff08;2)每一个结果发生的可能性大小相同. 2、在古典概型的假设下&#xff0c;设事件A包含样本空间S中的k个基本事件为,即(基本事件只含一个样本点),则 , 即古…

5. 等可能概型(古典概型)

文章目录 等可能概型(古典概型) 等可能概型(古典概型) 定义&#xff1a;若实验满足&#xff1a; 样本空间 S 种样本点有限&#xff08;有限性&#xff09;出现每一个样本点的概率相等&#xff08;等可能性&#xff09; 称这种试验为等可能概型&#xff08;或古典概型&#x…

古典概型、条件概率

文章目录 1 概率1.1 定义1.2 性质 2 古典概型2.1 定义2.2 计算公式 3 条件概率3.1 定义3.2 性质3.3 乘法定理 1 概率 1.1 定义 定义 (概率的公理化定义)&#xff1a;设 E E E 是随机试验&#xff0c;其样本空间 S S S &#xff0c;对于 E E E 的每一事件 A A A 赋于一个实…

概率笔记2——古典概型

上一章中通过几个示例对概率进行了初步介绍&#xff0c;从本章开始&#xff0c;将系统地介绍概率的相关知识。 基本概念 概率研究的是随机现象背后的客观规律——我们对随机没有兴趣&#xff0c;感兴趣的是通过大量随机试验总结出的数学模型。 随机试验 顾名思义&#xff0c;这…

概率统计·概率论的基本概念【古典概型、几何概型】

注意划线部分的这种表示方式 古典概型&#xff08;等可能概型&#xff09; 乘法原理 基本模型 箱中摸球 分组分配&#xff08;分球入箱&#xff09; 先给特殊元素分配 # —— 事件个数 以上题的思路如下&#xff1a; 例题 抽签模型 因为不知道前面人的结果&#xff0c;所以…

古典概型例题

【例1】一部四册的文集按任意次序放到书架上去&#xff0c;问各册自右向左或自左向右恰成 1&#xff0c;2&#xff0c;3&#xff0c;4 的顺序&#xff08;用 表示&#xff09;的概率是多少&#xff1f; 解 此随机试验的结果是四本书在书架上的一种放法&#xff0c;而每一…

概率论的学习和整理10:古典概型 和 N重伯努利试验 的概率和计算方法对比 -----(头脑要纠错!!!)

目录 1 古典概型&#xff08;等可能模型 / 等概率模型&#xff09; 1.1 古典概型的定义 1.2 现实的例子很多 1.3 古典概型的核心要求 1.4 古典概型的好处 1.4.1 足够直观 1.4.2 适应面广&#xff0c;只要基础事件概型相等即可套用 1.4.3 适应面广&#xff0c;只要各…

古典概型——概率论与数理统计(宋浩)

事件的概率 1.2.1概率的初等描述 概率的定义&#xff1a;事件发生的可能性的大小&#xff08;P&#xff08;A&#xff09;&#xff09; 性质&#xff1a; P&#xff08;Ω&#xff09;1&#xff0c;P&#xff08;φ&#xff09;0&#xff08;规范性&#xff09;0<P(A)&l…

移远 4G EC20 高通 9X07 工业级 车规级 CAT4 CAT6

EC20 是移远通信推出的最高LTE Cat 6无线通信模块&#xff0c;采用LTE 3GPP Rel.11 技术&#xff0c;支持最大下行速率300Mbps和最大上行速率50Mbps&#xff1b;同时在封装上兼容移远通信UMTS/HSPA UC20模块以及移远通信多网络制式LTE Cat 3 EC20模块&#xff0c;实现了3G网络与…

cat详解

1、概念 cat命令(concatenate的缩写)是Linux操作系统中使用最广泛的命令行实用工具之一。它是一个标准的Linux实用程序&#xff0c;用于查看文件的内容&#xff0c;而不需要在任何文本编辑器中打开它。cat命令的另一个主要用法是将多个文件串联到一个文件中。 2、基本参数 参…

hashcat详细使用教程

hashcat简介 hashcat是一款自称为世界上最快的密码破解工具。 hashcat常用命令 -m 指定哈希类型 -a 指定破解模式 -V 查看版本信息 -o 将输出结果储存到指…

CAT 服务端搭建

目录 前言 觉得没什么好写&#xff0c;这次搭建的过程和之前看到的文档有些不一样&#xff0c;估计以后还会不一样。但依旧记录一下&#xff0c;总结一下&#xff0c;凑凑数吧。CAT 项目github地址&#xff1a;https://github.com/dianping/catCAT 服务端官方部署介绍&#xff…