正确理解泊松分布

article/2025/8/30 2:49:08

很多人在上概率论这门课的时候就没搞明白过泊松分布到底是怎么回事,至少我就是如此。虽然那个时候大家都会背“当试验的次数趋于无穷大,而乘积np固定时,二项分布收敛于泊松分布”,大部分的教科书上也都会给出这个收敛过程的数学推导,但是看懂它和真正的理解还有很大距离。如果我们学习的意义是为了通过考试,那么我们大可停留在“只会做题”的阶段,因为试卷上不会出现“请发表一下你对泊松公式的看法”这样的题目,因为那样一来卷子就变得不容易批改,大部分考试都会出一些客观题,比如到底是泊松分布还是肉松分布。

而如果我们学习的目的是为了理解一样东西,那么我们就有必要停下来去思考一下诸如“为什么要有泊松分布?”、“泊松分布的物理意义是什么?”这样的“哲学”问题。

如果我们要向一个石器时代的人解释什么是电话,我们一定会说:“电话是一种机器,两个距离很远的人可以通过它进行交谈”,而不会说:“电话在18XX年由贝尔发明,一台电话由几个部分构成„„”(泊松分布在18XX年由泊松提出,泊松分布的公式是„„)所以我们问的第一个问题应该是“泊松分布能拿来干嘛?”

泊松分布最常见的一个应用就是,它作为了排队论的一个输入。什么是排队论?比如我们去每天食堂打饭,最头疼的一个问题就是排队,之所以要排队是因为食堂打饭的大叔有限,假设学校有1000个学生,而食堂恰好配了1000个大叔和打饭的窗口,那么就永远不会有人排队。但是出于经营成本方面的考虑食堂通常不会这么干,因此如何控制窗口的数量并且保证学生不会因为排队时间太长而起义是一门很高深的学问。

在一段时间t(比如1个小时)内来到食堂就餐的学生数量肯定不会是一个常数(比如一直是200人),而应该符合某种随机规律:比如在1个小时内来200个学生的概率是10%,来180个学生的概率是20%„„一般认为,这种随机规律服从的就是泊松分布。

也就是在单位时间内有k个学生到达的概率为:
在这里插入图片描述
其中lambda为单位时间内学生的期望到达数。

问题是“这个式子是怎么来的呢?”——我们知道泊松分布是二项分布满足某种条件的一个特殊形式,因此可以先从简单的二项分布入手,寻找两者之间的联系。

二项分布很容易理解,比如一个牛仔一枪打中靶子的概率是p,如果我们让他开10枪,如果每击中一次目标就得1分,问他一共能得几分?虽然我们不能在牛仔射击前准确地预测出具体的得分k,但可以求出k的概率分布,比如k=9的概率是50%,k=8分的概率是30%„„并且根据k的分布来判断他的枪法如何,这便是概率统计的思想。

具体计算的方法就是求出“得k分”的概率。比如“得9分”可以是“射失第1发,而命中其余的9发”,它的概率是p的9次方乘上1-p。
X O O O O O O O O O
O X O O O O O O O O
O O X O O O O O O O
„„
根据组合数性质,在(10,9)(组合数下标为10,上标为9)种情况下,牛仔都可以得到9分。因此牛仔“得9分”的概率 。

同理,“得k分”的概率就是
在这里插入图片描述
而对于一个神枪手(p=1)来讲, 他“得10分”的概率就是1。

二项分布和泊松分布最大的不同是前者的研究对象是n个离散的事件(10次射击),而后者考察的是一段连续的时间(单位时间)。因此泊松分布就是在二项分布的基础上化零为整。

如果我们把单位时间划分成n个细小的时间片,假设在每个时间片内牛仔都在射击,只是这次他发射的不是子弹,而是学生——“命中目标”就代表向食堂成功地发射出一个学生,如果“没有命中”就表示学生被打到了食堂意外的其它地方。如果n不是无穷大,那么在某个时间片内可能出现两个学生同时进入食堂的状况,这样的话就和我们假设任意的时间片内之可能发生“有一个学生出现”或“没有学生出现”不符,为了能用二项分布去近似泊松分布,因此n必须趋向无穷,时间片必须无穷小,这也是为什么泊松分布的前提之一是“n很大”的原因!(另一个前提是“p很小”)

这样一来我们就可以用二项分布的公式表示单位时间到来k个学生的概率了。在单位时间内发生n次独立的“发射学生”实验,把学生“发射”到食堂的概率是p

那么单位时间内食堂到来k个学生的概率:
在这里插入图片描述

把组合数展开,上下同乘:
在这里插入图片描述
得到:
在这里插入图片描述
把p^k拆成k个p连乘的形式放到左边分子上,
在这里插入图片描述
调整
在这里插入图片描述
因为
在这里插入图片描述

在这里插入图片描述
这就是我们熟悉的泊松公式,其中的lambda的物理意义是单位时间内学生到来的数量,也就是平均到达率,是一个常数。


http://chatgpt.dhexx.cn/article/TcQbdBch.shtml

相关文章

白话解释正态分布

复习一个统计学方面的课题,想找些资料看看,结果发现,就算是最基本的一些统计学概念,能找到的中文资料,读起来都是这么的佶屈聱牙,似乎都是从教科书里拷贝几个名词解释给放到一起,就算是一篇文章…

常用分布函数

0-1分布 设随机变量X只可能取0与1两个值,分布律为 则称X服从以p为参数的0-1分布 即 X 0 1 P 1-p p 用于描述: 对新生儿性别进行登记;检查产品质量是否合格;某车间的电力消耗是否超负荷 二项分布 设随机变量X只可能取0和1两个值&…

[R语言]正态分布

目录 分布 连续型变量的分布 正态分布 正态分布的推导 正态分布密度曲线 dnorm 正态分布的概率计算 正态分布累积曲线 总体分位数和尾概率 正态分布案例之一 R语言正态分布函数 正态分布相应的概率计算 正态分布的检验 shapiro.test()函数 Kolmogorov-Smirnov连续…

概率分布汇总

概率分布、总体分布、抽样分布,一开始很容易搞混,还以为是同一个理论,不同的概念,毕竟都是分布,又都是统计学里面的概率。今天就来理解理解这个东西吧。 概率分布是指随机变量的各取值与该取值对应的概率之间呈现的规…

拉普拉斯分布

如果随机变量的概率密度函数分布如下图所示,那么它就是拉普拉斯分布,记为x-Laplace(μ,λ),其中,μ 是位置参数,λ 是尺度参数。如果 μ 0,那么,正半部分恰好是尺度为 1/λ(或者λ&…

高斯分布

正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。 若随机变量X服从一个数学期望为μ、标准…

机器学习小组知识点23:F分布(F Distribution)-R语言代码

F分布的用途:用于方差分析、协方差分析和回归分析等。 定义 一个 F -分布的随机变量是两个卡方分布变量的比率: U1/d1U2/d2=U1/U2d1/d2 其中: U1和U2呈卡方分布,它们的自由度(degree of freedom)分别是d1和d2。 …

F分布及其应用

F分布是1924年英国统计学家R.A.Fisher提出,并以其姓氏的第一个字母命名的。它是一种非对称分布,有两个自由度,且位置不可互换。设X服从自由度为n1的卡方分布, Y服从自由度为n2的卡方分布,且X,Y独立,则称随机变量F=(X⁄n1 )/(Y⁄n2 )服从自由度为(n1,n2)的F分布,记为F~F…

TeamTalk各个服务的IP配置方案

本人微信公众号:CPP进阶之旅 如果觉得这篇文章对您有帮助,欢迎关注 “CPP进阶之旅” 学习更多技术干货 TeamTalk各个服务的IP配置方案 1.纯公司内网2.公网ip3.公网ip,路由器映射相关文章重要说明 TeamTalk源码中的IM_SERVER下共有8种服务器&a…

TeamTalk部署详细教程(最全最新TeamTalk部署教程助你一次部署成功)

本人微信公众号:CPP进阶之旅 如果觉得这篇文章对您有帮助,欢迎关注 “CPP进阶之旅” 学习更多技术干货 TeamTalk部署详细教程 背景1、更新操作系统2、删除已经安装的软件3、安装必要的依赖软件4、安装mysql4.1 下载4.2 解压编译4.3 添加mysql用户4.4 修改…

新版TeamTalk部署教程

原文转自蓝狐(bluefox)的博客:https://blog.csdn.net/simongyley/article/details/45535429。对文中部分问题做了修改。 0、简介 新版TeamTalk已经在2015年03月28日发布了,目前版本定为1.0.0版本,后续版本号会按照如下…

(TeamTalk服务端源码分析一)TeamTalk服务端部署

TeamTalk服务端部署 在分析TeamTalk的各个服务器代码之前,我们先搭建一套服务端环境,结合之前的客户端,看一下一个IM聊天工具的基本功能。 一、部署环境 系统:centos7 X64位 二,部署步骤 1, 安装git gcc …

windows 10 Docker Desktop TeamTalk 安装笔记

目录 1、运行docker centos:7 版本系统 1.1进入 docker系统 1.2更新系统 1.3安装依赖软件 2、安装MySQL 2.1下载解压mysql 2.2解压mysql 2.3 编译安装mysql 2.3创建mysql用户 2.4创建my.cnf配置 2.5初始化 2.6其他配置 2.7启动mysql 2.8修改密码 2.9完成mysq…

VS2013打包teamtalk

1 2. 如果是第一次打包的话,需要下载Installshield,按需下载,第二次打开就是我这样了 3. 4.修改图中箭头的地方,其他看你需求修改 5.因为teamtalk要用到.net4.5 6.重点!!! 首先点击addfolde…

teamtalk mysql.h_TeamTalk安装测试

TeamTalk介绍 项目框架 TeamTalk是蘑菇街的开源项目,github维护的最后时间是2015但是仍然是一款值得学习的好项目,麻雀虽小五脏俱全,本项目涉及到多个平台、多种语言,简单关系如下图 服务端: CppServer:TTC…

TeamTalk消息协议

数据通讯格式封装协议 Protocol Buffer 常用序列化方案比较 参考 https://www.cnblogs.com/johnny666888/p/12841735.html Protocol Buffer Protocol Buffer还有一个非常重要的优点就是可以保证同一消息报文新旧版本之间的兼容性 protobuf协议核心思想 基于128bits的数…

TeamTalk源码分析(1)

一、TeamTalk服务器端以下部署程序: db_proxy_server、file_server、http_msg_server、login_server、msfs、msg_server、push_server、router_server 各个服务程序的作用描述如下: LoginServer (C): 负载均衡服务器,分配一个负载小的MsgSe…

把TeamTalk(即时通讯项目)中的线程池连接池拆出来单独测试。

研究过Teamtalk的伙伴会发现它的线程池和连接池与很多文件有关联, 这篇文章主要写,把它的线程池连接池拆出来需要用到哪些文件。 其实我本来只想测试它的连接池的,但发现连接池里套的有线程池,于是就一起拆出来了。 整个工程的树…

teamtalk原理

再贴一遍架构图 从图中可以看出,对外使用的是http连接,内部使用的是tcp长连接。 类的命名规则:xxxServConn是模块连别的模块,xxxConn是别的模块连它。 协议设计 teamtalk采用protobuf进行序列化 typedef struct {uint32_t le…

TeamTalk源码分析(一)—— TeamTalk介绍

TeamTalk是蘑菇街开源的一款企业内部用的即时通讯软件(Enterprise IM),类似腾讯的RTX。网上也有很多的介绍,我这里也有写几遍关于这款产品的“流水账”,一方面对自己这段时间的阅读其代码做个总结,尽量做个…