
什么是正态分布?正态分布(Normal Distribution),也被称为高斯分布,代表着概率的分布情况,是统计学中的一个重要概念。
在科学理论不甚发达的过去,早期科学家们往往先从观察事物现象开始,发现、记录并试图归纳、总结,最后抽象出背后的规律。
当一组观察数据或样本涉及到“平均”和“偏差”时,它们出现的频率往往会被描绘成下面这条曲线:

图自百度百科
图中横轴代表着样本数值,纵轴则是某一样本数值对应的出现概率,其中这条曲线即正态分布曲线。
观察这个图形,正态曲线呈现出“钟”形,以 x=μ (均数所在的位置)为中心左右对称。曲线与横轴无穷接近,合成的面积为 1,代表所有样本出现的概率之和为 100%。
以数学的语言描绘这条曲线,
公式中包含两个参数,期望(均数)μ 和标准差 σ。
我们也常用更简化的形式描述什么是正态分布:N(μ,σ^2);μ 代表着分布的集中趋势,横轴上离 μ 越接近的值,出现的概率越大; σ^2 (方差)代表数据分布的离散程度,σ 越大,数据分布越分散