抽样分布之χ2 分布,t分布,F分布

article/2025/9/7 5:31:07


统计量的分布称为 抽样分布,在使用统计量进行统计推断时需要知道它的分布,当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般来说是困难的,下面介绍来自正态总体的几个常用统计量的分布.

1. χ 2 \chi^2 χ2 分布

  • 定义

    X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,,Xn 是来自总体 N ( 0 , 1 ) N(0,1) N(0,1)的样本,则称统计量 χ 2 = ∑ i = 1 n X i 2 , i = 1 , 2 , 3 ⋯ , n \chi^2 = \sum\limits_{i=1}^{n}X_i^2,\quad i = 1,2,3\cdots,n χ2=i=1nXi2,i=1,2,3,n 服从自由度为 n n n χ 2 \chi^2 χ2分布,记为 χ 2 ∼ χ 2 ( n ) . \chi^2\sim\chi^2(n). χ2χ2(n).

    此处的自由度是指独立变量的个数

  • χ 2 \chi^2 χ2分布的概率密度

    f ( y ) = { 1 2 n / 2 Γ ( n / 2 ) y n / 2 − 1 e − y / 2 , y > 0 0 , e l s e f(y) = \begin{cases} \frac{1}{2^{n/2}\Gamma(n/2)}y^{n/2-1}e^{-y/2},\quad y>0 \\\\0, \quad else\end{cases} f(y)=2n/2Γ(n/2)1yn/21ey/2,y>00,else

    其图像如下
    卡方分布pdf图

    • 图像为单峰曲线
    • 图像为非对称图形
    • n > 2 n>2 n>2时,在 n − 2 n-2 n2处取得最大值
    • n n n越大,峰越往右,图像也越趋于对称,当 n n n很大时,可近似看做正态分布
  • χ 2 \chi^2 χ2分布性质

    1. χ 2 \chi^2 χ2分布的可加性

      χ 1 2 ∼ χ 2 ( n 1 ) , χ 2 2 ∼ χ 2 ( n 2 ) \chi_1^2 \sim \chi^2(n_1),\chi_2^2 \sim \chi^2(n_2) χ12χ2(n1),χ22χ2(n2),并且 χ 1 2 , χ 2 2 \chi_1^2,\chi_2^2 χ12,χ22相互独立,则有 χ 1 2 + χ 2 2 ∼ χ 2 ( n 1 + n 2 ) \begin{aligned} \chi_1^2+\chi_2^2 \sim \chi^2(n_1+n_2) \end{aligned} χ12+χ22χ2(n1+n2)

    2. χ 2 \chi^2 χ2分的数学期望和方差

      E ( χ 2 ) = n , D ( χ 2 ) = 2 n . E(\chi^2)=n,D(\chi^2)=2n. E(χ2)=n,D(χ2)=2n.

      证明:

      由于 χ 2 = ∑ i = 1 n X i 2 \chi^2 = \sum\limits_{i=1}^{n}X_i^2 χ2=i=1nXi2,其中 X i ∼ N ( 0 , 1 ) X_i \sim N(0,1) XiN(0,1) ,因此有

      E ( X i 2 ) = D ( X i ) + ( E X i ) 2 = 1 + 0 = 1 E(X_i^2) = D(X_i)+(EX_i)^2 = 1+0=1 E(Xi2)=D(Xi)+(EXi)2=1+0=1

      因此 E ( χ 2 ) = n ∗ E ( X i 2 ) = n E(\chi^2) = n*E(X_i^2) = n E(χ2)=nE(Xi2)=n

      D ( χ 2 ) = n ∗ D ( X i 2 ) = n ∗ [ E ( X i 2 ) 2 − E ( X i 2 ) ] = n ∗ [ E ( X i 4 ) − E ( X i 2 ) ] = n E ( X i 4 ) − n \begin{aligned} D(\chi^2) &= n*D(X_i^2) \\&= n*[E(X_i^2)^2-E(X_i^2)] \\&= n*[E(X_i^4)-E(X_i^2)] \\&=nE(X_i^4)-n\end{aligned} D(χ2)=nD(Xi2)=n[E(Xi2)2E(Xi2)]=n[E(Xi4)E(Xi2)]=nE(Xi4)n

      我们需要知道 E ( X i 4 ) E(X_i^4) E(Xi4), 目前没有更好的方式,我们尝试使用期望的定义进行计算

      E ( X i 4 ) = ∫ − ∞ + ∞ x 4 1 2 π e − x 2 2 d x = 1 2 π ∫ − ∞ + ∞ x 4 e − x 2 2 d x = 1 2 π [ − x 3 e − x 2 2 ∣ − ∞ + ∞ + ∫ − ∞ + ∞ 3 x 2 e − x 2 2 d x ] = 0 + 3 ∫ − ∞ + ∞ 1 2 π x 2 e − x 2 2 d x = 3 ∫ − ∞ + ∞ x 2 1 2 π e − x 2 2 d x \begin{aligned} E(X_i^4) &= \int_{-\infty}^{+\infty}x^4\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx \\&= \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{+\infty}x^4e^{-\frac{x^2}{2}}dx \\&= \frac{1}{\sqrt{2\pi}}\bigg[-x^3e^{-\frac{x^2}{2}}\bigg|_{-\infty}^{+\infty}+\int_{-\infty}^{+\infty}3x^2e^{-\frac{x^2}{2}}dx\bigg] \\&=0+3\int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}}x^2e^{-\frac{x^2}{2}}dx \\&= 3\int_{-\infty}^{+\infty}x^2\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx\end{aligned} E(Xi4)=+x42π 1e2x2dx=2π 1+x4e2x2dx=2π 1[x3e2x2+++3x2e2x2dx]=0+3+2π 1x2e2x2dx=3+x22π 1e2x2dx

      这里对后面的积分项可继续采用分部积分方法进行处理,但是这地方其实有个技巧 ,根据期望定义有

      E ( X i 2 ) = ∫ − ∞ + ∞ x 2 1 2 π e − x 2 2 d x \begin{aligned} E(X_i^2) = \int_{-\infty}^{+\infty}x^2\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx \end{aligned} E(Xi2)=+x22π 1e2x2dx

      前面我们已经算出 E ( X i 2 ) = 1 E(X_i^2)=1 E(Xi2)=1

      因此有 E ( X i 2 ) = ∫ − ∞ + ∞ x 2 1 2 π e − x 2 2 d x = 1 \begin{aligned} E(X_i^2) = \int_{-\infty}^{+\infty}x^2\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx=1 \end{aligned} E(Xi2)=+x22π 1e2x2dx=1

      所以有 E ( X i 4 ) = 3 ∗ 1 = 3 E(X_i^4) = 3*1 = 3 E(Xi4)=31=3

      ∴ D ( χ 2 ) = n E ( X i 4 ) − n = 3 n − n = 2 n \therefore D(\chi^2) = nE(X_i^4)-n = 3n-n=2n D(χ2)=nE(Xi4)n=3nn=2n

  • χ 2 \chi^2 χ2分布的分位点

    对于给定的正数 α , 0 < α < 1 \alpha,\quad 0<\alpha<1 α,0<α<1,称满足条件 P { χ 2 > χ α 2 ( n ) } = ∫ χ α 2 ( n ) ∞ f ( y ) d y = α \begin{aligned} P\{\chi^2>\chi_\alpha^2(n)\} = \int_{\chi_\alpha^2(n)}^{\infty}f(y)dy = \alpha \end{aligned} P{χ2>χα2(n)}=χα2(n)f(y)dy=α 的点 χ α 2 ( n ) \chi_\alpha^2(n) χα2(n) χ 2 ( n ) \chi^2(n) χ2(n)分布的上 α \alpha α分位点


  • 补充 Γ \Gamma Γ函数介绍

    Γ ( x ) = ∫ 0 ∞ t x − 1 e − t d t . ( x > 0 ) \begin{aligned}\Gamma(x) = \int_0^{\infty}t^{x-1}e^{-t}dt.\quad(x>0)\end{aligned} Γ(x)=0tx1etdt.(x>0)

    • 性质 1 1 1

      Γ ( x + 1 ) = x Γ ( x ) \begin{aligned}\Gamma(x+1) = x\Gamma(x)\end{aligned} Γ(x+1)=xΓ(x)

      • 推论1

      Γ ( 2 ) = Γ ( 1 ) = 1 \Gamma(2)=\Gamma(1)=1 Γ(2)=Γ(1)=1

      • 推论2

      Γ ( 1 2 ) = π \Gamma(\frac{1}{2}) = \sqrt\pi Γ(21)=π

      • 推论3

      Γ ( n + 1 ) = n ! \Gamma(n+1) = n! Γ(n+1)=n!

    • 性质2

      对于 0 < x < 1 , Γ ( 1 − x ) Γ ( x ) = π s i n π x 0 <x <1,\quad\Gamma(1-x)\Gamma(x)=\frac{\pi}{sin\pi x} 0<x<1Γ(1x)Γ(x)=sinπxπ

  • 补充 Γ \Gamma Γ分布介绍

    Γ \Gamma Γ分布是统计学的一种连续概率函数,是概率统计中一种非常重要的分布。指数分布和χ2分布都是伽马分布的特例

    • 假设随机变量 X X X为等到第 α \alpha α件事发生所需的等候时间, 密度函数为

      f ( x , β , α ) = β α Γ ( α ) x α − 1 e − β x , x > 0 \begin{aligned} f(x,\beta,\alpha) = \frac{\beta^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x},\quad x>0 \end{aligned} f(x,β,α)=Γ(α)βαxα1eβx,x>0

      其中参数 α \alpha α为形状参数, β \beta β 为逆尺度参数

    • E ( X ) = α β , D ( X ) = α β 2 E(X) = \frac{\alpha}{\beta},D(X)=\frac{\alpha}{\beta^2} E(X)=βα,D(X)=β2α

    • Γ \Gamma Γ分布具有可加性

    • 当形状参数α=1时,伽马分布就是参数为 β \beta β的指数分布,即 X ∼ E ( β ) X\sim E(\beta) XE(β)

    • α = n 2 , β = 1 2 \alpha=\frac{n}{2},β=\frac{1}{2} α=2nβ=21时,伽马分布就是自由度为 n n n的卡方分布,即 X ∼ χ 2 ( n ) X\sim \chi^2(n) Xχ2(n)

2. t t t分布

  • 定义

    X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) X\sim N(0,1),Y\sim \chi^2(n) XN(0,1),Yχ2(n),且 X , Y X,Y X,Y相互独立,则称随机变量 t = X Y / n t=\frac{X}{\sqrt{Y/n}} t=Y/n X 服从自由度为 n n n t \pmb{t} ttt分布 . 记为 t ∼ t ( n ) . t\sim t(n). tt(n).

  • t t t分布概率密度

    h ( t ) = Γ [ ( n + 1 ) / 2 ] π n Γ ( n / 2 ) ( 1 + t 2 n ) − ( n + 1 ) / 2 , − ∞ < t < ∞ \begin{aligned} h(t) = \frac{\Gamma[(n+1)/2]}{\sqrt{\pi n}\Gamma(n/2)}\bigg(1+\frac{t^2}{n}\bigg)^{-(n+1)/2},\quad -\infty <t<\infty\end{aligned} h(t)=πn Γ(n/2)Γ[(n+1)/2](1+nt2)(n+1)/2,<t< 其图像如下

t分布pdf图

  • 以0为中心,左右对称的单峰分布;

  • n n n越小,曲线越低平; n n n越大,t分布曲线越接近标准正态分布曲线

  • n ≥ 30 n\geq30 n30时, t t t分布近似于标准正态分布

  • t t t分布的分位点

    对于给定的正数 α , 0 < α < 1 \alpha,\quad 0<\alpha<1 α,0<α<1,称满足条件 P { t > t α ( n ) } = ∫ t α ( n ) ∞ h ( t ) d t = α \begin{aligned} P\{t>t_\alpha(n)\} = \int_{t_\alpha(n)}^{\infty}h(t)dt = \alpha \end{aligned} P{t>tα(n)}=tα(n)h(t)dt=α 的点 t α ( n ) t_\alpha(n) tα(n) t ( n ) t(n) t(n)分布的上 α \alpha α分位点

    • h ( t ) h(t) h(t)图像的对称性可知 t 1 − α ( n ) = − t α ( n ) . t_{1-\alpha}(n) = -t_\alpha(n). t1α(n)=tα(n).

3. F F F分布

  • U ∼ χ 2 ( n 1 ) , V ∼ χ 2 ( n 2 ) U\sim \chi^2(n_1),V \sim \chi^2(n_2) Uχ2(n1),Vχ2(n2),且 U , V U,V U,V相互独立,则称随机变量 F = U / n 1 V / n 2 F=\frac{U/n_1}{V/n_2} F=V/n2U/n1服从自由度为 ( n 1 , n 2 ) (n_1,n_2) (n1,n2) F F F分布,记为 F ∼ F ( n 1 , n 2 ) . F\sim F(n_1,n_2). FF(n1,n2).

  • F F F分布概率密度

    ψ ( y ) = { Γ [ ( n 1 + n 2 ) / 2 ] ( n 1 / n 2 ) n 1 / 2 y ( n 1 / 2 ) − 1 Γ ( n 1 / 2 ) Γ ( n 2 / 2 ) [ 1 + ( n 1 y / n 2 ) ] ( n 1 + n 2 ) / 2 , y > 0 0 , e l s e \begin{aligned}\psi(y) = \begin{cases} \frac{\Gamma[(n_1+n_2)/2](n_1/n_2)^{n_1/2}y^{(n_1/2)-1} }{\Gamma(n_1/2)\Gamma(n_2/2)[1+(n_1y/n_2)]^{(n_1+n_2)/2}},\quad &y>0 \\\\ 0, &else \end{cases}\end{aligned} ψ(y)=Γ(n1/2)Γ(n2/2)[1+(n1y/n2)](n1+n2)/2Γ[(n1+n2)/2](n1/n2)n1/2y(n1/2)1,0,y>0else

    其图像为

F分布pdf图

  • 由定义可知,若 F ∼ F ( n 1 , n 2 ) F\sim F(n_1,n_2) FF(n1,n2),则 1 F ∼ F ( n 2 , n 1 ) \frac{1}{F}\sim F(n_2,n_1) F1F(n2,n1)

  • F F F分布的分位点

    对于给定的正数 α , 0 < α < 1 \alpha,\quad 0<\alpha<1 α,0<α<1,称满足条件 P { F > F α ( n 1 , n 2 ) } = ∫ F α ( n 1 , n 2 ) ∞ ψ ( y ) d y = α \begin{aligned} P\{F>F_\alpha(n_1,n_2)\} = \int_{F_\alpha(n_1,n_2)}^{\infty}\psi(y)dy = \alpha \end{aligned} P{F>Fα(n1,n2)}=Fα(n1,n2)ψ(y)dy=α 的点 F α ( n 1 , n 2 ) F_\alpha(n_1,n_2) Fα(n1,n2) F ( n 1 , n 2 ) F(n_1,n_2) F(n1,n2)分布的上 α \alpha α分位点.

    • 分位点性质

      F 1 − α ( n 1 , n 2 ) = 1 F α ( n 2 , n 1 ) . F_{1-\alpha}(n_1,n_2)=\frac{1}{F_\alpha(n_2,n_1)}. F1α(n1,n2)=Fα(n2,n1)1.

      证明如下

      根据 F F F分布分位点的定义可知

      P { F > F 1 − α ( n 1 , n 2 ) } = 1 − α ∴ P { 1 F < 1 F 1 − α ( n 1 , n 2 ) } = 1 − α 此 时 有 P { 1 F ≥ 1 F 1 − α ( n 1 , n 2 ) } = 1 − ( 1 − α ) = α 再 次 根 据 分 位 数 定 义 , 有 1 F 1 − α ( n 1 , n 2 ) = 1 F α ( n 1 , n 2 ) ∴ F 1 − α ( n 1 , n 2 ) = 1 F α ( n 2 , n 1 ) \begin{aligned} P\{F>F_{1-\alpha}(n_1,n_2) \} &= 1-\alpha \\ \therefore P\{\frac{1}{F}<\frac{1}{F_{1-\alpha}(n_1,n_2)}\} &=1-\alpha \\此时有 P\{\frac{1}{F}\geq \frac{1}{F_{1-\alpha}(n_1,n_2)}\} &=1-(1-\alpha)=\alpha \\再次根据分位数定义,有\frac{1}{F_{1-\alpha}(n_1,n_2)}&=\frac{1}{F_{\alpha}(n_1,n_2)} \\ \therefore F_{1-\alpha}(n_1,n_2)&=\frac{1}{F_\alpha(n_2,n_1)}\end{aligned} P{F>F1α(n1,n2)}P{F1<F1α(n1,n2)1}P{F1F1α(n1,n2)1}F1α(n1,n2)1F1α(n1,n2)=1α=1α=1(1α)=α=Fα(n1,n2)1=Fα(n2,n1)1


http://chatgpt.dhexx.cn/article/Cn9s0HDU.shtml

相关文章

t检验、t分布、t值

1. t检验的历史 阿瑟健力士公司&#xff08;Arthur Guinness Son Co.&#xff09;是一家由阿瑟健力士&#xff08;Arthur Guinness&#xff09;于1759年在爱尔兰都柏林建立的一家酿酒公司&#xff1a; 不过它最出名的却不是啤酒&#xff0c;而是《吉尼斯世界纪录大全》&#xf…

详解三大抽样分布:t分布、卡方分布、F分布

转载自https://www.cnblogs.com/think-and-do/p/6509239.html T分布&#xff1a;温良宽厚 本文由“医学统计分析精粹”小编“Hiu”原创完成&#xff0c;文章采用知识共享Attribution-NonCommercial-NoDerivatives 4.0国际许可协议(http://creativecommons.org/licenses/by-nc-…

几大分布:正态分布、卡方分布、t分布、F分布整理

一、正态分布 正态分布&#xff08;Normal distribution&#xff09;又名高斯分布&#xff08;Gaussiandistribution&#xff09;&#xff0c;若随机变量X服从一个数学期望为μ、方差为σ2的高斯分布&#xff0c;记为N(μ&#xff0c;σ2)。其概率密度函数为正态分布的期望值μ…

数理统计三大分布:卡方分布、t分布、F分布

数理统计三大分布&#xff1a;卡方分布、t分布、F分布 正态分布卡方分布定义概率密度函数性质 t分布定义概率密度函数性质 F分布定义概率密度函数性质 Attention 正态分布 由于 χ 2 \chi^2 χ2&#xff08;chi-squard&#xff09;分布、t分布、F分布都是由正态分布构造的&…

卡方分布、F分布、t分布和正态分布的关系

这三个分布都是基于正态分布变形得到的&#xff0c;在实际中只能用来做假设检验。比如卡方分布&#xff08;chi-square distribution, χ-distribution&#xff0c;或写作χ分布&#xff09;&#xff0c;已知样本X都是服从正态分布的样本&#xff0c;而且方差未知&#xff0c;那…

T 分布(近似标准正态分布)

1.1 定义 定义:假设X服从标准正态分布N(0,1),Y服从卡方分布,那么的分布称为自由度为n的t分布,记为。 T分布密度函数其中,Gam(x)为伽马函数。

关于t分布

上一篇文章提及了卡方分布,本文接着介绍另一类重要的抽样分布–t分布。 简单说一下背景,“t”,是Fisher为之取的名字。Fisher最早将这一分布命名为“Student’s distribution”,并以“t”为之标记。Student,则是William Sealy Gosset(戈塞特)的笔名。他当年在爱尔兰都柏…

三大抽样分布:卡方分布,t分布和F分布

卡方分布 定义&#xff1a; 用途 卡方检验&#xff1a;卡方检验主要用于分类变量之间的独立性检验 基本思想&#xff1a;卡方表示观察值与理论值之间的偏离程度。 相关性质 t分布 定义&#xff1a; 应用&#xff1a; t -分布&#xff08;t-distribution&#xff09;用于根据…

如何理解t检验、t分布、t值?

t检验、t分布、t值其实都是同一个数学概念中的不同部分。 1 t检验的历史 阿瑟健力士公司&#xff08;Arthur Guinness Son & Co.&#xff09;是一家由阿瑟健力士&#xff08;Arthur Guinness&#xff09;于1759年在爱尔兰都柏林建立的一家酿酒公司&#xff1a; 不过它最出…

elementui 级联选择器的用法

1.级联选择器的html结构&#xff1a; <!-- 添加分类的对话框 --><el-dialog title"添加分类" :visible.sync"addCateDialogVisible" width"50%" close"addCateDialogClosed"><!-- 添加分类的表单 --><el-form :m…

级联、并联和反馈系统

通过查阅相关资料&#xff0c;对级联、并联和反馈系统进行学习&#xff0c;主要通过等效函数和等效系统方框图来进行相关介绍。&#xff08;文中图片来自于自动控制网&#xff09; 1、级联系统 等效函数为&#xff1a; 等效框图为&#xff1a; 2、并联系统 等效函数为&…

Vue级联选择器

后端&#xff1a;后端返回的结果格式res如下 [{"value": zhinan,"label": 指南,"children": [{"value": shejiyuanze,"label": 设计原则,"children": [{"value": yizhi,"label": 一致}, {&qu…

级联选择框

文章目录 实现级联选择框效果图实现前端工具版本添加依赖main.js导入依赖级联选择框样式 后端数据库设计 实现级联选择框 效果图 实现 前端 工具版本 node.js v16.6.0vue3 级联选择框使用 Element-Plus 实现 添加依赖 在 package.json 添加依赖&#xff0c;并 npm i 导入…

Oracle数据库中的级联查询、级联删除、级联更新操作教程

这里整理了Oracle中的三种级联操作,其中Oracle定义外健的时候可以定义级联删除,但是没有级联修改的语法,当然可以用触发器实现,下面我们详细来看Oracle数据库中的级联查询、级联删除、级联更新操作教程 级联查询 在ORACLE 数据库中有一种方法可以实现级联查询 select * //…

级联网络

目录 级联 mtcnn级联人脸检测网络 级联 级联&#xff08;cascade&#xff09;在计算机科学里指多个对象之间的映射关系&#xff0c;建立数据之间的级联关系提高管理效率 中文名 级联 外文名 Cascade 类 型 映射关系 另 指 用来设计一对多关系 重复性的操作十…

信息级联(Information cascade)

文章目录 一、信息级联的定义1.1 信息级联的两步过程 二、基本模型三、文献Review3.1 信息级联起源的相关描述文献 四、相关资料提供 一、信息级联的定义 信息瀑布&#xff0c;又称信息级联。描述了当人们的选择受到前人信息的影响&#xff0c;放弃自己喜好&#xff0c;追随前…

级联相关网络

文章转自https://blog.csdn.net/xc_xc_xc/article/details/53163478 介绍 一般的神经网络是固定好拓扑结构&#xff0c;然后训练权重和阈值。级联相关神经网络是从一个小网络开始&#xff0c;自动训练和添加隐含单元&#xff0c;最终形成一个多层的结构。 级联相关神经网络具…

交换机——级联、堆叠和集群

交换机的连接主要有三种方式&#xff0c;级联方式、堆叠方式和集群方式。级联方式实现简单&#xff0c;只需一根普通的双绞线即可&#xff0c;节约成本而且基本不受距离的限制。而堆叠方式投资相对较大&#xff0c;且只能在很短的距离内连接&#xff0c;实现起来比较困难。集群…

一张图彻底理解级联!!!!!

1 学生表中肯定包含多条记录 每一条记录代表一名学生 因为 每一条记录保存了一名学生的核心信息: 该学生的姓名,性别,学生证号 但是 学生表中必须给每一条记录一个编号id 为什么 就是为了级联!!! 事实上 每个表我们都会倾向于给一个编号id 为什么? 为了…

级联

2019独角兽企业重金招聘Python工程师标准>>> 级联,英语:Cascade。是计算机科学里比较常见的概念。通常是指多个对象按照一定的规则有级别地或者是有梯度地联接在一起,也就是按照树形结构有层次地把对象组织在一起。 ■应用: 级联的应用比较广泛,表现在很多方…