卡方分布是抽样分布的一种。抽样分布其实与概率论中的大数定律有密切的关系。当关注的对象的概率不可知,意味着只知道数据,不知道其内在规律;另一方面,关注的对象是可以分解成多种因素的组合时,就引入了抽样分布。抽样分布是描述从多个随机变量中抽取数据并且加以组合后,形成的规律。基本的抽样分布有三个:x^2(卡方)分布、F分布、t分布。本文介绍卡方分布。
设随机变量X_1,X_2,⋯X_n相互独立,都服从N(0,1),则称
服从自由度为n的 x^2 (卡方)分布,记为x^2 ~x^2(n)(下面直接用卡方分布来代替)。自由度指包含的独立变量的个数。卡方分布是由正态分布构造而成的一个新的分布,当自由度n很大时,卡方分布近似为正态分布。
概率密度函数为:
另外一张图来展现卡方分布的概率密度函数和分布函数的规律。
(注:图像来自网络)
因为卡方分布也是一种概率分布,所以概率