数学基础--高斯分布详解

article/2025/8/21 19:44:54

1、简介

  正态分布(Normal Distribution),又名高斯分布(Gaussian Distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

  约翰·卡尔·弗里德里希·高斯(Johann Carl Friedrich Gauss)是德国著名数学家、物理学家、天文学家、大地测量学家,他是近代数学奠基者之一,被认为是历史上最重要的数学家之一,并享有“数学王子”的美誉。他的头像也被印在以前德国的官方货币(德国马克 10 马克)上,如图 1 所示。
在这里插入图片描述
  有一种说法认为,高斯和阿基米德、牛顿并列为世界三大数学家,虽然这个说法没有得到书面和史料方面的支持。但是客观地评价,高斯、阿基米德、牛顿这3位科学家对于数学发展的贡献确实都是丰碑性质的,这点毋庸置疑。

2、高斯分布详解

  先来看一下高斯分布的概率密度函数:
在这里插入图片描述
  上图所示为高斯密度函数的函数曲线。
在这里插入图片描述
  上图为高斯密度函数的函数曲线,熟悉高斯分布的人自然觉得非常亲切,不熟悉高斯分布的朋友估计会感觉有些不知所云,这里简单介绍一下。

  先介绍一下什么是概率密度函数,大家知道,y=f(x) 这种表达式是以前在中学学习函数时使用的一种表达式,表示函数值 y 和自变量 x 函数关系,f(x) 展开之后就具体解释了 x 参与运算的过程。而概率密度实际指的是 y=f(x),x 是样本特性自变量,y 是 x 在这个样本特性上的数量比例。exp 指的是自然常数 e 的幂函数,即 e 的多少次幂的概念(e 是一个无理数,也就是无限不循环小数,e≈2.71828…)。这个函数的峰值在 x=μ 的位置,此时对应的函数值 y 为:
在这里插入图片描述
  其实,这里样本数量的计算用的是定积分的定义,即整个函数曲线在其下方围住的与 y=0(x 轴)所围成的面积占比。它在 x=μ 左右两侧的函数是对称的:

  • x 在 μ-σ 和 μ+σ 之间的样本数量占到整个样本数量的 68.2%;
  • x 在 μ-2σ 和 μ+2σ 之间的样本数量占到整个样本数量的 95.4%;
  • x 在 μ-3σ 和 μ+3σ 之间的样本数量占到整个样本数量的99.6%;

  高斯分布作为分布特性的一种,首先是用来描述统计对象的,如果统计对象的分布特性符合高斯分布,那么所有针对高斯分布的定理和“经验值”就能够直接套用。而高斯分布本身在自然界的应用是非常广泛的,用一句话解释高斯分布所表现的分布特点就是“一般般的很多,极端的很少”。

  这里举一个具体的例子,假如对某一地区的男性身高做了一个随机抽样,一共 1000 人,结果发现他们的身高是一个 μ=175cm 的高斯分布,σ=10cm。那么首先,这样一个描述就已经能够清晰地说明这个抽样检查的结果了,而以下结论也就随之成立(图 3 )。

  • 身高 165~175cm 的人(大约)有 341 名。
  • 身高 175~185cm 的人(大约)有 341 名。
  • 身高 155~165cm 的人(大约)有 136 名。
  • 身高 185~195cm 的人(大约)有 136 名。
  • 身高 145~155cm 的人(大约)有 21 名。
  • 身高 195~205cm 的人(大约)有 21 名。
    1000人的身高分布
      这些数量基本已经涵盖了统计总人数的 99.6 %。需要注意的是,根据统计的情况在不同的条件下 μ 和 σ 的值可能会不同:
  • μ 较大,则整个函数图像的中轴向右挪动比较多。
  • μ 较小,则函数图像的中轴向左挪动比较多。
  • σ 较大,则整个曲线绵延比较长,整个坡度显得平缓。
  • σ 较小,整个曲线窄而立陡。

  符合高斯分布特性的对象是非常多的,平时也会看到很多这种“一般般的很多,极端的很少”的现象。如平时小区里的汽车,其中中档的比较多,高级的比较少,特别破的也比较少(在不同档次的社区注意 μ 可能会不同,就是平均水平在不同小区之间可能偏差很多,高档小区的车普遍比较好,μ 就比较大;低档小区的车普遍不大好,μ 就比较小)。如某小区如图 4 所示,大部分人买的汽车都 30 万左右,价格高的和低的汽车数量都随着与 30 万的距离变大而渐变少。
汽车的价格与数量关系
  我们平时接触的人里,智慧一般的人很多,非常聪明的人较少,非常愚笨的人也较少(在一些大公司或者重点学校里虽然整体的聪明程度提高,但是还是存在这个小范围内的高斯分布,即 μ 比较偏右,而 σ 比较小)。如某公司全体员工集体做了一次 IQ 测试(智商测试),测试结果表明智商在 110 附近的人最多,智商在 90 到 100 之间的较少,同时智商在 120 到 130 之间的较少,而智商在 80 到 90 之间以及 130 到 140 之间的就更少了(图 5)。这也符合人们一般性的认知。
智商与人数关系

  再如,全社会范围内的收入,中档次收入的人比较多,特别贫穷和特别富裕的人较少,但是他们在地域上的分布和职业类别上的分布可能就不那么均匀了。诸如此类的例子还有很多。

3、高斯分布应用

  首先刚才说过,如果在统计过程中发现一个样本呈现高斯分布的特性,只需要把样本总数量、μ 和 σ 表述出来,就已经能够形成一个完整的画面感了。这对人们描述对象是有很大帮助的。还有一个好处,就是我们发现了这样一个特性以后,在生产制造、商业等领域会有很多对应性的用法能够减少不必要的投入或损失。

  例如,在设计一款服装后,S/M/L/XL 这些号码怎么设计比较合理呢?设计完了制造多少较合理呢?这时就可以在抽样后在高斯分布曲线上找到这些合适的点。既然 μ-σ 和 μ+σ 之间已经占 68.2%了,那么如果没有足够的预算或者精力,可以只先尝试做一个以 μ 为标准的板式,针对一部分人打板做市场推广。因为再做 μ-σ 和 μ+σ 这两个如此不同的板式,打板成本将会再提高 2 倍,但是增益仅有不到 50%(这从概率密度函数上就可以看出来)。这其实就是一种针对市场迎合的分析和尝试,即优先做那些受众情况最一般、人数最集中的部分。

  再如,常常会听到“二八法则”这种说法,在不同的场景里这可能是高斯分布的一种形式。假设正在经营一家游戏公司,公司有一款刚起步不久的产品 A 游戏,A 游戏有 1 万用户,如果想做这一款游戏的用户拓展工作应该怎么去考虑呢?

  或许可以尝试这样:先看看这 1 万用户中每个用户平均在游戏里充值花多少钱,做一个排名。不花钱玩的人会不少,还有一些花极多的钱来玩游戏的玩家,中间的是中坚力量(用户数量大),每个人花费的额度适中,持续周期较长,这样的一群人更值得关注。对于这些用户,如果能够知道他们加入游戏的渠道的分布比例,就有理由相信这些渠道的特点和它们覆盖这些用户的特点是有相关性的。

  例如,这些表活跃的用户究竟是经由在大学校园里做宣传活动加入的,还是由于在某些游戏门户网站发的广告加入的,还是通过某些免费软件的推广渠道加入的。那么如果想扩大这部分用户的数量可以对应地加大这部分渠道的流量。至少直观上看,这比盲目地进行全方位立体交叉的广告投放效果要好。

参考资料:
《高斯分布(正态分布)函数用法详解》


http://chatgpt.dhexx.cn/article/7IPJKQAq.shtml

相关文章

Latex学习(1)——latex中的字体颜色

格式: \textcolor{color}{text} 例子: \textcolor{white}{白色}\ \textcolor{linen}{亚麻色}\​ \textcolor{black}{黑色}\ \textcolor{grey}{灰色}\ \textcolor{lightgrey}{浅灰色}\ \textcolor{darkgrey}{深灰色}\​ \textcolor{red}{红色}\ \textcolo…

【LaTeX 教程】04. LaTeX 插入数学公式与符号

【LaTeX 教程】04. LaTeX 插入符号与数学公式 LaTeX 公式 我将把握最近文章里用到的数学公式格式都放上来供大家参考学习 首先 最简单的数学模式 $xxx$ %一个$符号,中间的内容是行内模式 $$xxx$$ %两个$符号,中间的内容是行间模式(行间模式会单独占…

【科普向】LaTeX简介(一篇极简的 LaTeX 介绍文章)

文章目录 LaTeX诞生背景TeX和LaTeXLaTeX主要功能文档结构数学公式公式块 我们平时在word里新建一个doc(x)文件后,输入内容,调整页边距、字体大小、行间距等待,然后交给打印机打印就可以了。 如果你写了一篇关于新疆棉花的文章,20…

用LaTex代码写数学公式

文章目录 公式符号1.上下标 ^ _2.分子分母 \frac{}{}3.根号 \sqrt4.极限 \lim\limits极限换行:\atop 5.积分 \int_下限^上限一重积分号 \int二重积分号 \iint三重积分号 \iiint封闭积分 \oint积分号变大 6.累加、累乘累加 \sum累乘 \prod\limits 7.戴帽符号 \hat{}、…

LaTeX新手半小时速成手册(不速成你打我

期末大作业LaTeX排版,一个学期没听课,学了b站半小时完成大作业。写此速成手册以作备忘。 b站链接:小风寒呐 1. primary 一篇论文最主要的构成,以中文为例 1.1 整体框架 1.1.1 声明类 相当于在说:“我想写一篇文章…

简述c语言中break的作用,c语言break什么意思?

break在一些计算机语言中是保留字,其作用大多情况下是终止上一层的循环,以C语言来说,break在switch(开关语句)中在执行一条case后跳出语句的作用。 1、 C语言中的break : break语句通常用在循环语句和开关语句中。当break用于开关…

c语言break能与if用吗,break可以用于if吗

break语句也可以用于if体内,它可退出if语句 可 对?reak 看似在if 语句中执行,如: for(s1;s2;s3) { if(b1)break; else s4; } 但事实上这里的break;是执行在for语句中的,跳出的是for语句。 即使输入 if(b1) 这也是跳出外层的for语句或switch语句而已。 此解答仅供参考。 b…

C++中break与continue的用法

根据break的用法,是在循环体内,强行结束循环的执行,也就是结束整个循环的过程,不再执行循环的条件是否成立,直接转向循环语句下面的语句。 continue的作用:在循环语句中,跳出本次循环中余下尚未…

UART的break信号

目录 1.TTL电平和RS232电平 2.UART的时序 3.break信号 4.如何检测break信号? 最近的一个项目用到了UART的break信号,在查资料的过程中,发现很多文章对break信号有介绍,但是都很简单,看了让人摸不着头脑&#xff0c…

c++ break语句

break语句 brea语句是用来跳出switch或者循环体结构的语句。循环语句中的break用法与switch类似&#xff0c;可以直接忽视条件判断而直接跳出循环。 break在for循环中的用法 #include<iostream> using namespace std;//break语句int main() {for ( int i0;i<10;i){…

break和continue

break和continue的作用和区别是什么&#xff1f; 一、break和continue的作用 二、break和continue的区别 三、案例分析 一、break和continue的作用 break和continue都是用来控制循环结构的&#xff0c;主要作用是停止循环。 二、break和continue的区别 1、break用于跳出一…

break关键字

1、break关键字用于 while、for 循环时&#xff0c;会终止循环而执行整个循环语句后面的代码。break 关键字通常和 if 语句一起使用&#xff0c;即满足条件时便跳出循环。这里强调一下&#xff0c;如果存在多层循环的时候&#xff0c;break只会跳出当前循环&#xff1b;下面是测…

break用法

参考例程 1 -> 用于for循环 for(;;){// Afor(;;) {// Bbreak; // 只跳出B的for循环}}参考例程 2 -> 用于switch int i;switch&#xff08;i&#xff09;{case 1:break; // 跳出Switchcase 2:break; // 跳出Switchdefault:break; // 跳出Switch}总结 1、break 在一些…

break 通过自定义标签跳到指定位置

实现比较简单&#xff0c;但是不常用&#xff0c;所以本篇博客作为一个笔记使用&#xff0c;因代码简单&#xff0c;直接粘贴代码和运行结果 public class Tets {public static void main(String[] args) {b:for(;;){System.out.println("bbbbbbbbbbbbbbbbbbbbbb");…

c#语言break语句用法,C# break语句

C# 中的break语句主要有两个用法&#xff1a; 在循环中使用&#xff0c;当循环中遇到break语句时&#xff0c;循环将立即终止&#xff0c;程序控制在循环之后的下一个语句中恢复。 它可以用于终止switch语句中的case语句。 如果使用嵌套循环(即在一个循环中使用另一个循环)&…

matlab中break语句,MATLAB break语句

本文概述 break语句终止for循环或while循环的执行。当遇到break语句时, 执行将继续循环外的下一条语句。在嵌套循环中, break仅存在于最内部的循环中。 句法 break 以下是在MATLAB中使用break语句时的要点 break关键字用于定义break语句。 break语句终止或停止for或while循环的…

break语句

break语句 break译为&#xff1a;中断 定理&#xff1a; 1、break语句可以结束当前循环的执行 2、执行完break语句后&#xff0c;循环体中位于break语句后面的语句就不会被执行 3、在多重循环中&#xff0c;break语句只向外跳一层 只能在循环体内或switch语句中使用break语句…

break的相关知识

break&#xff0c;continue的相关知识 &#xff08;1&#xff09;只能在循环体内和switch语句体内使用break&#xff0c;注意在循环体内即可&#xff0c;比如循环体内的if语句中也可用break&#xff0c;其实通常break语句与if语句联用&#xff0c;用于满足某种条件直接退出循环…

break语句的作用

关于break语句的适用范围 1.情形&#xff1a;在循环体中&#xff0c;常常会有许多if语句&#xff0c;if语句内部往往会出现break或continue语句&#xff0c;那么此时跳出的究竟是if语句还是循环语句呢&#xff1f; 2.break语句的作用&#xff1a;跳出当前循环体&#xff0c;也…