概率论基础 —— 3.离散型、连续型概率模型,及其概率密度与概率分布函数

article/2025/10/14 14:02:58

在前面的文章里,已经带大伙了解了概率论的概率事件类型,以及针对某些事件的发生概率,以及针对全部场景的某事件的发生概率等基本知识。不过对于统计学专业来说,或者实际应用来说,接触最多的还是离散型和连续型概率,以及分析其概率密度与分布函数。所以说这里的内容可以算是概率论真正的支撑核心和基石。
无论你做数据分析,还是说人工智能方向,这是你应该打好的基础中的基础。

文章目录

  • 离散型及连续型概率模型的基本定义
  • 什么是概率模型的概率密度与概率分布函数
  • 积分换元法与概率中的换元计算
  • 一些相关例题
    • 1. 离散型随机变量、分布函数
    • 2. 离散型随机变量函数的分布
    • 3. 连续型的概率密度、分布函数
    • 4. 连续型随机变量函数的分布

离散型及连续型概率模型的基本定义

在研究生阶段,或者说在实际的工作阶段,经常可以看到关于连续和离散的讨论。我这里不想过多的讨论这个问题,只是简单的说一下,离散型,就相对于散数列,而连续型本质上是运动变化的连续描述。所以把数学上经常见到的两种不同类型的数据做到一张图表上,就是下面这个样子。

在这里插入图片描述
这是一张连续信号和离散信号的表达方式。对于概率来说,由于不存在 < 0 < 0 <0 的情况,所以其各自的函数图就表现为:

在这里插入图片描述
那么根据概率的一般规律或者说属性,那就是针对定义域上的全部事件概率之和为1。那么对于离散型我们就可以知道,

F { X ≤ x r i g h t m o s t } = P 1 + P 2 + P 3 + ⋯ + P n = 1 F\left \{ X \leq x_{rightmost} \right \} = P_1 + P_2 + P_3 + \cdots + P_n = 1 F{Xxrightmost}=P1+P2+P3++Pn=1

即,把每个点的事件概率连续相加;而连续型,则是对函数图像求积分

F ( x ) = ∫ a b f ( x ) d x = 1 F(x) = \int_{a}^{b} f(x) dx = 1 F(x)=abf(x)dx=1

那么,一般在讨论到概率分布函数,即概率累计函数 F ( X ) F(X) F(X) 的时候,我们在上面那个概率分布图画一个向左侧覆盖的框。

在这里插入图片描述
框里所覆盖的部分,就是对样本事件概率的加和,即:

F ( X ) = ∑ x k ≤ x P k F(X) = \sum_{x_k \leq x} P_k F(X)=xkxPk

所以,从以上不难得出,如果样本覆盖覆盖范围, F ( X < x 0 ) F(X < x_0) F(X<x0) ,即 F ( X ) F(X) F(X)取值范围不包括概率事件最左侧的样本概率,那么得出的累计概率(即分布函数)为0。

所以很容易求证出以下两条性质:

  • F ( − ∞ ) = 0 F(-\infty) = 0 F()=0
  • F ( + ∞ ) = 1 F(+\infty) = 1 F(+)=1

什么是概率模型的概率密度与概率分布函数

我个人不太喜欢从教科书的定义出发去理解概率密度与概率分布函数。既然它们的函数意义与微积分一样,那么不如直接从微积分的定义出发去理解函数的概率密度与概率分布更为方便。

通常提到概率密度,一般针对连续型的概率。我这里单刀直入,从概率分布函数(概率累加函数)的演算性质,它所对应的就是定积分概念里的求函数面积的过程。因此,从定积分的概念出发,很容易把概率的密度函数,和概率的分布函数统一到定积分里的导函数 f ( x ) f(x) f(x) 与原函数 F ( X ) F(X) F(X)这一概念里。

当然,对于连续型:

F ( X ) = ∫ a b f ( x ) d x F(X) = \int_{a}^{b} f(x) dx F(X)=abf(x)dx

  • F ( X ) F(X) F(X) 是定积分里的原函数,也是概率里的分布函数
  • f ( x ) f(x) f(x) 是定积分里的导函数,也是概率里的概率密度函数

这样,我们把概念统一在一起后,对于理解离散型、连续型概率模型的概率密度与概率分布函数就显然简单太多了,因为我们可以把很多在定积分里,甚至不定积分里适用的工具全都拿到连续概率里,对我们来说无非求“面积/斜率”,显然这里用微积分工具明显更容易理解。

积分换元法与概率中的换元计算

直接看公式不是很容易理解,所以我也不是很理解国内的教科书为什么总喜欢跳过重要的基础知识点。这个,是连续型概率的重要知识点。所以我这里补充一些积分换元法的知识点,从而能让你从更为直观的角度理解概率论中连续型概率的换元运算背后的数学逻辑。

首先从链式法则出发,当一个函数是复合函数 ( g ∘ f ) ( x ) (g \circ f)(x) (gf)(x) 对它的求导,等于:

F ( X ) ′ = ( g ∘ f ) ′ ( x ) = g ′ ( f ( x ) ) f ′ ( x ) F(X)' = (g \circ f)'(x) = g'(f(x))f'(x) F(X)=(gf)(x)=g(f(x))f(x)

所以针对复合函数的积分,也可以根据导数的链式法则进行扩展,于是有:

∫ a b F ( X ) ′ d X = ∫ α β g ′ ( f ( t ) ) f ′ ( t ) d t \int_a^b F(X)' d X = \int_{\alpha}^{\beta} g'(f(t)) f'(t) dt abF(X)dX=αβg(f(t))f(t)dt

只不过需要注意,就是积分项 d X dX dX 换到了 d t dt dt,所以导致了积分区域也会跟着一起发生改变。接着,然后我们换一种写法,令 F ′ ( X ) = f ( x ) F'(X) = f(x) F(X)=f(x), f ( t ) = φ ( t ) f(t) = \varphi(t) f(t)=φ(t),于是得到了第二类积分换元法,

∫ a b f ( x ) d x = ∫ α β f [ φ ( t ) ] φ ′ ( t ) d t \int_a^b f(x) dx = \int_{\alpha}^{\beta} f[\varphi(t)] \varphi '(t) d t abf(x)dx=αβf[φ(t)]φ(t)dt

这里并不难,难得是对数学符号的理解,你如果反应慢,建议多花点时间看一看,自己手动推导一遍看看。至于关键的 α \alpha α β \beta β,应该取什么值的问题,这里用到的就是反函数的概念了,即:

φ ( α ) = a → α = φ − 1 ( a ) \varphi (\alpha) = a \rightarrow \alpha = \varphi^{-1}(a) φ(α)=aα=φ1(a)
φ ( β ) = b → β = φ − 1 ( b ) \varphi (\beta) = b \rightarrow \beta = \varphi^{-1}(b) φ(β)=bβ=φ1(b)

然后,你再对比一下概率论里提到这部分的章节,是不是就理解了该死的概率换元公式,到底怎么得来的了吧。

f Y ( y ) = f X ( h ( y ) ) ∣ h ′ ( y ) ∣ f_Y(y) = f_X(h(y)) |h'(y)| fY(y)=fX(h(y))h(y)

除了取绝对,其他简直一模一样。所以,你应该记住这里的概念,之后遇到类似的题目时,这些概念会成为我们解题的重要手段。

然后,跟其他章节里一样,我们来做点习题吧。

一些相关例题

1. 离散型随机变量、分布函数

盒中有6个球,其中4个白球,2个黑球,从中任取2个球,求:

  • (1)抽到白球数X的分布律
  • (2)随机变量X的分布函数

解(1)
所谓分布律,是指每一种样本的概率集合(Distribution),所以先分析白球的样本,X取值范围可以是:0,1,2
P { X = 0 } = C 4 0 C 2 2 C 6 2 = 1 15 P \left \{ X = 0 \right \} = \frac{C_4^0 C_2^2}{C_6^2} = \frac{1}{15} P{X=0}=C62C40C22=151
P { X = 1 } = C 4 1 C 2 1 C 6 2 = 8 15 P \left \{ X = 1 \right \} = \frac{C_4^1 C_2^1}{C_6^2} = \frac{8}{15} P{X=1}=C62C41C21=158
P { X = 2 } = C 4 2 C 2 0 C 6 2 = 6 15 P \left \{ X = 2 \right \} = \frac{C_4^2 C_2^0}{C_6^2} = \frac{6}{15} P{X=2}=C62C42C20=156

然后绘制样本概率表

X012
P1/158/156/15

解(2)
根据上题中的样本概率表,我们可以得出概率累加函数(或者说分布函数)

即:

F ( X ) = { 0 x < 0 1 / 15 0 ≤ x < 1 9 / 15 1 ≤ x < 2 1 2 ≤ x F(X) = \left\{\begin{matrix} 0 & x < 0 \\ 1/15 & 0 \leq x < 1 \\ 9/15 & 1 \leq x < 2 \\ 1 & 2 \leq x \end{matrix}\right. F(X)=01/159/151x<00x<11x<22x

这里的x并非取值范围。而是x处于坐标轴上什么位置,向左 ∑ \sum 的计算。即:

在这里插入图片描述

2. 离散型随机变量函数的分布

设随机变量X的分布律如下:

X-1012
P0.40.30.20.1
  • (1) U = X − 1 U = X - 1 U=X1 的分布律
  • (2) W = X 2 W = X^2 W=X2 的分布律

解:

首先计算新分布函数的分布律,根据题目给出的公式,我们有:

P0.40.30.20.1
X-1012
U-2-101
W1014

所以,我们可以根据上表,分别做出(1)和(2)的分布律

解(1)

U-2-101
P0.40.30.20.1

解(2)

W1014
P0.40.30.20.1

这里要稍微调整一下,于是有了:

W014
P0.30.60.1

3. 连续型的概率密度、分布函数

设连续型随机变量X的概率密度函数为 f ( x ) = { a + x 2 0 ≤ x < 1 0 e l s e f(x) = \left\{\begin{matrix} a + x^2 & 0 \leq x < 1 \\ 0 & else \end{matrix}\right. f(x)={a+x200x<1else
(1). 常数 a
(2). P { X > = 0.5 } P \left \{ X >= 0.5 \right \} P{X>=0.5}
(3). 分布函数F(X)

解(1)

从概率密度函数的定义出发,我们有:

∫ f ( x ) d x = 1 → ∫ e l s e f ( x ) d x + ∫ 0 1 ( a + x 2 ) d x = 1 \int f(x) dx = 1 \rightarrow \int_{else} f(x) dx + \int_0^1 (a+ x^2) dx = 1 f(x)dx=1elsef(x)dx+01(a+x2)dx=1

根据密度函数f(x)给出的条件,可以知道上式可以简化为:

∫ 0 1 ( a + x 2 ) d x = 1 \int_0^1 (a+ x^2) dx = 1 01(a+x2)dx=1

然后根据导积分的运算规则,获得原函数为:

∫ 0 1 ( a + x 2 ) d x = ( a x + 1 3 x 3 ) ∣ 0 1 = 1 \int_0^1 (a+ x^2) dx = \left. (ax + \frac{1}{3} x^3) \right |_0^1 = 1 01(a+x2)dx=(ax+31x3)01=1

代入上限和下限后,可以得到

a + 1 3 = 1 → a = 2 3 a+ \frac{1}{3} = 1 \rightarrow a = \frac{2}{3} a+31=1a=32

解(2)
由于上面已经得到了 a=2/3,所以可以得到概率密度函数为:

f ( x ) = { 2 3 + x 2 0 ≤ x < 1 0 e l s e f(x) = \left\{\begin{matrix} \frac{2}{3} + x^2 & 0 \leq x < 1 \\ 0 & else \end{matrix}\right. f(x)={32+x200x<1else

P { X > = 0.5 } P \left \{ X >= 0.5 \right \} P{X>=0.5} 即求解对于连续型概率,样本大于等于0.5后出现的事件概率,即对概率密度函数求积的过程。于是有:

P { X > = 0.5 } = ∫ 0.5 + ∞ f ( x ) d x = ∫ 0.5 1 f ( x ) d x + ∫ 1 ∞ f ( x ) d x P \left \{ X >= 0.5 \right \} = \int_{0.5}^{+\infty} f(x) dx = \int_{0.5}^{1} f(x) dx + \int_1^{\infty} f(x) dx P{X>=0.5}=0.5+f(x)dx=0.51f(x)dx+1f(x)dx

根据题干给出的条件,可以知道 ∫ 1 ∞ f ( x ) d x = 0 \int_1^{\infty} f(x) dx = 0 1f(x)dx=0,所以问题简化为:

P { X > = 0.5 } = ∫ 0.5 1 f ( x ) d x = ∫ 0.5 1 [ 2 3 + x 2 ] d x P \left \{ X >= 0.5 \right \} = \int_{0.5}^{1} f(x) dx =\int_{0.5}^{1} [\frac{2}{3} + x^2]dx P{X>=0.5}=0.51f(x)dx=0.51[32+x2]dx

然后根据导积分的运算规则,获得:

P { X > = 0.5 } = ( 2 3 x + 1 3 x 3 ) ∣ 0.5 1 = 5 8 P \left \{ X >= 0.5 \right \} = \left. (\frac{2}{3}x + \frac{1}{3} x^3) \right |_{0.5}^{1} = \frac{5}{8} P{X>=0.5}=(32x+31x3)0.51=85

解(3)

我们根据以上各题,可以轻易的得到分布函数F(X)为

F ( X ) = { 0 x < 0 2 3 x + 1 3 x 3 0 ≤ x < 1 1 1 ≤ x F(X) = \left\{\begin{matrix} 0 & x < 0 \\ \frac{2}{3}x + \frac{1}{3} x^3 & 0 \leq x < 1 \\ 1 & 1 \leq x \end{matrix}\right. F(X)=032x+31x31x<00x<11x

需要记住的是 F(X) 与 f(x) 是导数和原函数的关系。

4. 连续型随机变量函数的分布

设随机变量X的概率密度为 f ( x ) = { x / 8 0 < x < 4 0 e l s e f(x) =\left\{\begin{matrix} x/8 & 0 < x < 4 \\ 0 & else \end{matrix}\right. f(x)={x/800<x<4else 求Y = 2X + 8的概率密度。

f(x) 是关于X的概率密度函数,所以要先得到关于X的分布函数,再更新Y的分布函数,然后对Y求导可以得到Y的密度函数,于是遵从这个思想,我们可以做如下解题过程。

(1):先从X的密度函数出发,得到关于X的分布函数

F x ( X ) = { x 2 16 0 < x < 4 0 e l s e F_x(X) =\left\{\begin{matrix} \frac{x^2}{16} & 0 < x < 4 \\ 0 & else \end{matrix}\right. Fx(X)={16x200<x<4else

(2):从关于Y的分布函数出发,得到关于X的分布函数替代式: X = (Y - 8) / 2 然后带入到上面的公式去:

F y ( Y ) = { ( Y − 8 2 ) 2 / 16 0 < ( Y − 8 2 ) / 16 < 4 0 e l s e F_y(Y) = \left\{\begin{matrix} (\frac{Y- 8}{2})^2 / 16 & 0 < (\frac{Y- 8}{2}) / 16 < 4 \\ 0 & else \end{matrix}\right. Fy(Y)={(2Y8)2/1600<(2Y8)/16<4else

(3):对上式化简一下:

F y ( Y ) = { ( Y − 8 2 ) 2 / 16 8 < Y < 16 0 e l s e F_y(Y) = \left\{\begin{matrix} (\frac{Y- 8}{2})^2 / 16 & 8 < Y < 16 \\ 0 & else \end{matrix}\right. Fy(Y)={(2Y8)2/1608<Y<16else

(4):对上式求导后,可以得到关于Y的概率密度函数。另外,由于 F y ( Y ) F_y(Y) Fy(Y)是复合函数,所以使用链式法则:

[ ( Y − 8 2 ) 2 / 16 ] ′ = 2 16 ( Y − 8 2 ) 1 2 = Y − 8 32 [(\frac{Y- 8}{2})^2 / 16]' = \frac{2}{16} (\frac{Y- 8}{2}) \frac{1}{2} = \frac{Y-8}{32} [(2Y8)2/16]=162(2Y8)21=32Y8

于是,

f y ( Y ) = { Y − 8 32 8 < Y < 16 0 e l s e f_y(Y) = \left\{\begin{matrix} \frac{Y-8}{32} & 8 < Y < 16 \\ 0 & else \end{matrix}\right. fy(Y)={32Y808<Y<16else

这里你可以尝试使用一下公式法进行替代,不过我个人比较推荐从定义入手,毕竟这样不容易错。


http://chatgpt.dhexx.cn/article/bTtiWXVf.shtml

相关文章

概率论的离散型随机变量和连续型随机变量

借鉴大佬的 下面附上网址 https://blog.csdn.net/ckk727/article/details/103435150 随机变量 随机变量是指变量的值无法预先确定仅以一定的可能性(概率)取值的量。 它是由于随机而获得的非确定值&#xff0c;是概率中的一个基本概念。 在经济活动中&#xff0c;随机变量是某…

计量经济学 联合假设检验 F统计量

考虑这样一个问题&#xff0c;现在你拥有1个被解释变量y和4个解释变量&#xff0c;如何判断x3,x4这2个变量是没有必要的&#xff1f; 或者换个说法&#xff0c;你现在有x1&#xff0c;x2这2个解释变量&#xff0c;突然你在寻找数据时&#xff0c;发现了另外2个变量x3&#xff0…

概率的性质——连续性

概率的连续性如下定义&#xff1a; 我们可以用韦恩图把他们表示出来&#xff0c;便于理解&#xff1a; 图1 对应性质&#xff08;1&#xff09; 图2 对应性质&#xff08;2&#xff09; 从图1中我们可以看出&#xff0c;集合单调不增&#xff0c;打个比方&#xff0c;此集合…

连续and离散系统的描述

系统的描述 系统的分类系统的框图表示系统的特性和分析方法时域离散系统 把最好的分享给大家&#xff0c;大家一起努力&#xff01; 系统的分类 连续系统与离散系统&#xff1a;输入和输出均为连续时间信号的系统称为连续时间系统&#xff1b;输入和输出均为离散时间信号的系统…

统计学:离散型和连续型随机变量的概率分布

主要随机变量一览表 随机变量概率分布均值方差一般离散型变量 p(x)的表、公式或者图 ∑xxp(x) ∑x(x−μ)2p(x) 二项分布 p(x)Cxnpxqn−x (x0,1,2,3⋅⋅⋅,n) np npq 泊松分布 p(x)λxe−λx! (x0,1,2,⋅⋅⋅) λ λ 超几何分布 p(x)CxrCn−xN−rCnN nrN r(N−r)n(N−n)N2(N−…

随机变量-离散-连续-假设检验方法

一组随机样本数据需要进行分析处理时&#xff0c;往往需要用到假设检验&#xff0c;对于离散变量discrete多用卡方检验&#xff0c;连续变量continuous用t检验或wilcoxon秩序和检验&#xff0c;具体的的使用场景如下 离散变量-卡方检验-适用条件 四格表&#xff1a; 所有的理…

常用的几种API获取ip地理位置的使用方法

最近公司让做一个用户登录、付费的时候记录操作人的地理位置。 搜了很多帖子&#xff0c;一开始用的淘宝的api&#xff0c;但是用了一段时间发现&#xff0c;这个api当获取的次数多了之后&#xff0c;就报404了&#xff0c;导致很多记录没有记录地址&#xff0c;虽然淘宝这个ap…

IP属地信息哪里来的?手把手教你实现通过IP查询属地信息

本文主要讲解IP查询属地信息的实现方法&#xff0c;以及基于Spring Boot实现IP属地信息查询项目。 〇、前言 近日&#xff0c;多个网络公众平台纷纷公开显示用户的IP属地&#xff0c;并且用户无法开启或关闭此功能。 用户的IP信息&#xff0c;平台是怎么知道的&#xff1f; …

php 精准定位到街道,ip地址查询精确到街道_ip查询详细地址带地图

ip地址查询精确的位置方法,我们知道,QQ能够查询到i地址对于的用户的位置,但是有时候因为运营商等原因导致 2.查询非移动网络3G/4G的IP地址;这是因为移动3G/4G网络下所使用的公网IP属于多人共用可以定位到街道级别。 IP定位工具(精准到.下载地址:http://pan.baidu.com/s/1o7…

IP地理位置定位技术原理是什么

IP地理位置定位技术的原理是基于IP地址的网络通信原理和基础上的。它利用IP地址所包含的一些信息&#xff0c;如网络前缀和地址段&#xff0c;以及ISP的IP地址归属地数据库&#xff0c;来推测IP地址所对应的地理位置。 具体来说&#xff0c;IP地址是由32位二进制数字组成的&…

Golang — 根据IP获取地理位置信息

Golang — 根据IP获取地理位置信息 1 介绍1.1 ip2region1.2 geoip2-golang1.3 总结 2 使用2.1 ip2region2.2 geoip2-golang 1 介绍 1 ip2region 2 geoip2-golang 1.1 ip2region ip2region 是一个离线IP地址定位库和IP定位数据管理框架&#xff0c;10微秒级别的查询效率&…

python通过ip获取地理位置等ip信息

作者讲话&#xff1a;本人是一个菜鸟勿喷本文章仅供娱乐。 ps&#xff1a;以后可以线下挑战了&#xff0c;直接顺着网线找到你&#xff01;哈哈哈 查询IP数据网站 使用结果1 ‘http://freeapi.ipip.net/ip’ 中文网站 使用结果2 ‘http://ip-api.com/json/ip’ 外国网站 实…

如何利用IP地址确定地理位置

近年来&#xff0c;基于IP地址的网络应用层出不穷&#xff0c;主要包括定向广告、社交网络、网络安全、网络服务性能优化、用户位置画像等。 互联网用户的物理位置对于很多不同类型的应用是有不同的用处的。以搜索引擎为首等应用通常会使用用户的位置来自定义对用户请求的响应。…

python根据IP查询地理位置

实现了输入ip地址返回该ip对应的信息。 如图&#xff1a;解释如下&#xff1a; 打开百度&#xff0c;输入ip打开调试界面&#xff0c;点击图中3号位置过滤在图中4号框位置输入想要查询的ip&#xff0c;然后点查询依次点击图中5、6&#xff0c;找到timestamp字段&#xff0c;粘…

教你如何使用ip地址进行高精度定位

IP这个概念大部分人都很熟悉了&#xff0c;这里IP的意思不是个人标签&#xff0c;而是IP地址&#xff08;英语&#xff1a;Internet Protocol Address&#xff09;是一种在Internet上的给主机编址的方式&#xff0c;也称为网际协议地址。IP地址是IP协议提供的一种统一的地址格式…

windows访问Ext4磁盘

作者 QQ群&#xff1a;852283276 微信&#xff1a;arm80x86 微信公众号&#xff1a;青儿创客基地 B站&#xff1a;主页 https://space.bilibili.com/208826118 参考 在Windows下读取Ext4分区 推荐一款Windows下读取 Linux文件系统Ext4的最佳软件 Paragon ExtFS api-ms-win-cr…

【Linux】Linux Ext2文件系统

下面以Linux的Ext2为例介绍文件系统的组成。 Ext2采用了分立式目录结构&#xff0c;即一个文件的目录分为目录项和索引节点两个部分。 Ext2的索引节点 在一个实际分立式目录的文件系统中&#xff0c;索引节点&#xff08;inode&#xff09;主要需要两部分内容来支持&#xff…

EXT2文件系统实现原理

目录 一 EXT2文件系统结构概览 2 1.1 EXT2文件系统结构框图 2 1.2 EXT2重要数据结构 3 二 块缓存 6 三 EXT2文件系统挂载 7 3.1 注册ext2文件系统类型 7 3.2 ext2文件系统挂载 7 3.3文件系统操作 9 EXT2文件系统结构概览 1.1 EXT2文…

模拟实现EXT2文件系统

设计EXT2文件系统 实验目的 &#xff08;1&#xff09;掌握文件系统的工作原理 &#xff08;2&#xff09;理解文件系统的主要数据结构 &#xff08;3&#xff09;学习较为复杂的 Linux 下的编程 &#xff08;4&#xff09;了解 EXT2 文件系统的结构 实验内容 设计并实现…

WIN10访问linux分区「ext2fsd」

尝试ext2explore、Paragon ExtFS都不好用&#xff0c;强烈安利ext2fsd&#xff0c;可读写&#xff0c;很强大 转自&#xff1a;https://blog.csdn.net/cruise_h/article/details/12894135 ext2fsd是国人发起的项目&#xff0c;主页 http://www.ext2fsd.com/ 下载&#xff1a;h…