正态分布

article/2025/8/29 23:23:13

正态分布

我们来对某一个年级做一项调查,看一看这个年级到底有多巨。于是,他们统计了每个同学一周刷题的时间。得到的结果如下:

统计
可以看出,大多数人每周都有7-8个小时做题,有少部分蒟蒻(比如我)每周只有1-3个小时做题,而一些神犇(比如这位)每周有13-15个小时刷题。

整个图表大致上是轴对称的。中间最多,两边最少。这种分布图称为正态分布

正态分布又称为高斯分布,他是由高斯发现的。正态分布也是最常见的概率分布。对于上面那个例子,我们统计足够多的人、将时间区间分的足够小之后,就可以画出他的概率密度曲线:
正态分布
概率密度曲线一定满足 ∫ − ∞ + ∞ f ( x ) = 1 \int_{-\infty}^{+\infty}f(x)=1 +f(x)=1正态分布也不例外。

其实上面的例子并不是真正的正态分布,因为不存在负时间。但是,真正的正态分布的概率密度曲线可以向负无穷和正无穷无限延伸。图像以 x x x轴为渐近线,也就是:
lim ⁡ x → ∞ f ( x ) = 0 \lim\limits_{x\rightarrow\infty}f(x)=0 xlimf(x)=0
我们的高斯给出了正态分布的数学表达式:

f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 f(x)=\dfrac1{\sqrt{2\pi}\sigma}e^{-\dfrac{(x-\mu)^2}{2\sigma^2}} f(x)=2π σ1e2σ2(xμ)2

通常我们用 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)来表示正态分布。

其中 μ \mu μ是数学期望,就是图像上的对称轴。在之前的例子中就是平均每个人每周能有多长时间做题。换句话说,图像关于 μ \mu μ对称, f ( μ + c ) = f ( μ − c ) f(\mu+c)=f(\mu-c) f(μ+c)=f(μc)

期望

σ \sigma σ是标准差,也就是图像上的"峰"陡峭程度。标准差越大,数据越分散,标准差越小,数据越集中。

方差
正态分布满足期望、中位数和众数相同,都是对称轴。图像的最高点 f ( μ ) = 1 2 π σ f(\mu)=\dfrac1{\sqrt{2\pi}\sigma} f(μ)=2π σ1

回忆一下初中地理的内容。年降水量其实就是服从了正态分布。


(随便找了个图贴上)

人的身高也近似是正态分布。
身高
可以说,大多数概率分布都是正态分布。甚至连宇宙信号噪声这样看似随机的变量,如果你对每个时刻的每个值进行统计,它也是正态分布的。这样的噪声也沾上了高斯分布的荣光,故名高斯噪声

在正态分布中,有这样一种特殊的正态分布。它不高不矮,不胖不瘦,不偏不倚。它,叫做,标准正态分布

标准正态分布之所以标准,并不是因为大多数正态分布都是标准正态分布,而是他的概率密度函数图像就很标准。

标准正态分布的概率密度函数是 φ ( x ) = 1 2 π e − x 2 2 \varphi(x)=\dfrac1{\sqrt{2\pi}}e^{-\dfrac{x^2}2} φ(x)=2π 1e2x2

也就是 N ( 0 , 1 ) N(0,1) N(0,1)

标准正态分布图像关于 x = 0 x=0 x=0对称。任何正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)都可以通过线性变换变成标准正态分布。变换方法如下:

x ∼ N ( μ , σ 2 ) x\sim N(\mu,\sigma^2) xN(μ,σ2),则 y = x − μ σ ∼ N ( 0 , 1 ) y=\dfrac{x-\mu}\sigma \sim N(0,1) y=σxμN(0,1)

我们用 φ \varphi φ表示标准正态分布的概率密度曲线, Φ \Phi Φ表示概率分布曲线。

根据概率分布曲线的定义,若 x ∼ N ( 0 , 1 ) x\sim N(0,1) xN(0,1),则

P ( a < x < b ) = Φ ( b ) − Φ ( a ) P(a<x<b)=\Phi(b)-\Phi(a) P(a<x<b)=Φ(b)Φ(a)

所以,若 x ∼ N ( μ , σ 2 ) x\sim N(\mu,\sigma^2) xN(μ,σ2)

P ( a < x < b ) = Φ ( b − μ σ ) − Φ ( a − μ σ ) P(a<x<b)=\Phi(\dfrac{b-\mu}\sigma)-\Phi(\dfrac{a-\mu}\sigma) P(a<x<b)=Φ(σbμ)Φ(σaμ)

在最后,我说一下" 3 σ 3\sigma 3σ标准"

我们通过查表可以知道:

P ( ∣ x − μ ∣ < σ ) ≈ 0.6826 P(|x-\mu|<\sigma)\approx0.6826 P(xμ<σ)0.6826
P ( ∣ x − μ ∣ < 2 σ ) ≈ 0.9544 P(|x-\mu|<2\sigma)\approx0.9544 P(xμ<2σ)0.9544
P ( ∣ x − μ ∣ < 3 σ ) ≈ 0.9974 P(|x-\mu|<3\sigma)\approx0.9974 P(xμ<3σ)0.9974

所以, x x x的取值几乎全集中在 ( μ − 3 σ , μ + 3 σ ) (\mu-3\sigma,\mu+3\sigma) (μ3σ,μ+3σ)区间中,在这个区间外面的概率不到 0.3 % 0.3\% 0.3%


http://chatgpt.dhexx.cn/article/rfetV9S0.shtml

相关文章

广义pareto分布_帕累托分布广义帕累托分布

PDF、PMF、CDF 1. 概念解释 PDF:概率密度函数(probability density function), 在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。 PMF:概率质量函数(probability mass fun…

离散均匀分布

离散均匀分布 n 个值中的每一个具有相等的概率 1/ n 截图来源&#xff1a;Discrete Uniform Distribution 例子&#xff1a; 投掷一个骰子6个值中每个值出现的概率为 1 / 6 1/6 1/6 投掷两个骰子出现的两值之和&#xff0c;结果分布不再均匀&#xff0c;因为并非所有和的概率都…

平均分布

转载请注明出处&#xff1a;http://blog.csdn.net/liu_sn/article/details/79333368 今天遇到本很好玩的书&#xff0c;《世界是随机的:大数据时代的概率统计学》&#xff0c;在讲分布的时候作者说&#xff1a;概率分布就是概率论中的小九九。很有意思&#xff0c;看了之后确实…

边缘分布

什么是边缘分布函数&#xff0c;有那些性质 设 F ( x , y ) F(x,y) F(x,y)为随机变量 ( X , Y ) (X,Y) (X,Y)的分布函数&#xff0c;则 F ( x , y ) P { X ≤ x , Y ≤ y } F(x,y)P\{X \le x,Y \le y\} F(x,y)P{X≤x,Y≤y} 令 y → ∞ y \rightarrow \infty y→∞&#xff…

度分布的概念及形状

一、度分布的概念 把网络中节点的度按从小到大排序&#xff0c;从而统计得到度为k的节点占整个网络节点数的比例怕p k _k k​。例如下图&#xff1a; 从概率统计的角度看&#xff0c;p k _k k​也可以视为网络中一个随机选择的节点的度为k的概率&#xff0c;这就是度分布的概…

正确理解泊松分布

很多人在上概率论这门课的时候就没搞明白过泊松分布到底是怎么回事&#xff0c;至少我就是如此。虽然那个时候大家都会背“当试验的次数趋于无穷大&#xff0c;而乘积np固定时&#xff0c;二项分布收敛于泊松分布”&#xff0c;大部分的教科书上也都会给出这个收敛过程的数学推…

白话解释正态分布

复习一个统计学方面的课题&#xff0c;想找些资料看看&#xff0c;结果发现&#xff0c;就算是最基本的一些统计学概念&#xff0c;能找到的中文资料&#xff0c;读起来都是这么的佶屈聱牙&#xff0c;似乎都是从教科书里拷贝几个名词解释给放到一起&#xff0c;就算是一篇文章…

常用分布函数

0-1分布 设随机变量X只可能取0与1两个值&#xff0c;分布律为 则称X服从以p为参数的0-1分布 即 X 0 1 P 1-p p 用于描述: 对新生儿性别进行登记&#xff1b;检查产品质量是否合格&#xff1b;某车间的电力消耗是否超负荷 二项分布 设随机变量X只可能取0和1两个值&…

[R语言]正态分布

目录 分布 连续型变量的分布 正态分布 正态分布的推导 正态分布密度曲线 dnorm 正态分布的概率计算 正态分布累积曲线 总体分位数和尾概率 正态分布案例之一 R语言正态分布函数 正态分布相应的概率计算 正态分布的检验 shapiro.test()函数 Kolmogorov-Smirnov连续…

概率分布汇总

概率分布、总体分布、抽样分布&#xff0c;一开始很容易搞混&#xff0c;还以为是同一个理论&#xff0c;不同的概念&#xff0c;毕竟都是分布&#xff0c;又都是统计学里面的概率。今天就来理解理解这个东西吧。 概率分布是指随机变量的各取值与该取值对应的概率之间呈现的规…

拉普拉斯分布

如果随机变量的概率密度函数分布如下图所示&#xff0c;那么它就是拉普拉斯分布&#xff0c;记为x-Laplace&#xff08;μ,λ)&#xff0c;其中&#xff0c;μ 是位置参数&#xff0c;λ 是尺度参数。如果 μ 0&#xff0c;那么&#xff0c;正半部分恰好是尺度为 1/λ(或者λ&…

高斯分布

正态分布&#xff08;Normal distribution&#xff09;又名高斯分布&#xff08;Gaussian distribution&#xff09;&#xff0c;是一个在数学、物理及工程等领域都非常重要的概率分布&#xff0c;在统计学的许多方面有着重大的影响力。 若随机变量X服从一个数学期望为μ、标准…

机器学习小组知识点23:F分布(F Distribution)-R语言代码

F分布的用途&#xff1a;用于方差分析、协方差分析和回归分析等。 定义 一个 F -分布的随机变量是两个卡方分布变量的比率: U1/d1U2/d2=U1/U2d1/d2 其中&#xff1a; U1和U2呈卡方分布&#xff0c;它们的自由度&#xff08;degree of freedom&#xff09;分别是d1和d2。 …

F分布及其应用

F分布是1924年英国统计学家R.A.Fisher提出,并以其姓氏的第一个字母命名的。它是一种非对称分布,有两个自由度,且位置不可互换。设X服从自由度为n1的卡方分布, Y服从自由度为n2的卡方分布,且X,Y独立,则称随机变量F=(X⁄n1 )/(Y⁄n2 )服从自由度为(n1,n2)的F分布,记为F~F…

TeamTalk各个服务的IP配置方案

本人微信公众号&#xff1a;CPP进阶之旅 如果觉得这篇文章对您有帮助&#xff0c;欢迎关注 “CPP进阶之旅” 学习更多技术干货 TeamTalk各个服务的IP配置方案 1.纯公司内网2.公网ip3.公网ip&#xff0c;路由器映射相关文章重要说明 TeamTalk源码中的IM_SERVER下共有8种服务器&a…

TeamTalk部署详细教程(最全最新TeamTalk部署教程助你一次部署成功)

本人微信公众号&#xff1a;CPP进阶之旅 如果觉得这篇文章对您有帮助&#xff0c;欢迎关注 “CPP进阶之旅” 学习更多技术干货 TeamTalk部署详细教程 背景1、更新操作系统2、删除已经安装的软件3、安装必要的依赖软件4、安装mysql4.1 下载4.2 解压编译4.3 添加mysql用户4.4 修改…

新版TeamTalk部署教程

原文转自蓝狐&#xff08;bluefox&#xff09;的博客&#xff1a;https://blog.csdn.net/simongyley/article/details/45535429。对文中部分问题做了修改。 0、简介 新版TeamTalk已经在2015年03月28日发布了&#xff0c;目前版本定为1.0.0版本&#xff0c;后续版本号会按照如下…

(TeamTalk服务端源码分析一)TeamTalk服务端部署

TeamTalk服务端部署 在分析TeamTalk的各个服务器代码之前&#xff0c;我们先搭建一套服务端环境&#xff0c;结合之前的客户端&#xff0c;看一下一个IM聊天工具的基本功能。 一、部署环境 系统&#xff1a;centos7 X64位 二&#xff0c;部署步骤 1&#xff0c; 安装git gcc …

windows 10 Docker Desktop TeamTalk 安装笔记

目录 1、运行docker centos:7 版本系统 1.1进入 docker系统 1.2更新系统 1.3安装依赖软件 2、安装MySQL 2.1下载解压mysql 2.2解压mysql 2.3 编译安装mysql 2.3创建mysql用户 2.4创建my.cnf配置 2.5初始化 2.6其他配置 2.7启动mysql 2.8修改密码 2.9完成mysq…

VS2013打包teamtalk

1 2. 如果是第一次打包的话&#xff0c;需要下载Installshield&#xff0c;按需下载&#xff0c;第二次打开就是我这样了 3. 4.修改图中箭头的地方&#xff0c;其他看你需求修改 5.因为teamtalk要用到.net4.5 6.重点&#xff01;&#xff01;&#xff01; 首先点击addfolde…