t检验、t分布、t值

article/2025/9/7 9:59:52

1. t检验的历史

  阿瑟·健力士公司(Arthur Guinness Son Co.)是一家由阿瑟·健力士(Arthur Guinness)于1759年在爱尔兰都柏林建立的一家酿酒公司:

在这里插入图片描述

  不过它最出名的却不是啤酒,而是《吉尼斯世界纪录大全》:

在这里插入图片描述

  1951年11月10日,健力士酒厂的董事休·比佛爵士(Sir Hugh Beaver)在爱尔兰韦克斯福德郡打猎时,因为没打中金鸻,于是和同行们争论哪种鸟飞得最快,彼此争论不休。由于当时的参考资料并不足以回答这个问题,这促使比弗想出版一本记载世界之最的书,这就是后来的《吉尼斯世界纪录大全》。

在这里插入图片描述  在健力士公司,戈斯特提出了t检验以降低啤酒质量监控的成本,但健力士酒厂为了保护公司的商业机密和智慧财产,明文禁止员工发表文章。

  戈斯特并没有因为这项规定而放弃他的学术研究发表,他在《生物统计期刊》以“学生”(The Student)为笔名,发表了关于t检验的文章,所以t检验又称为“学生t检验”。

  直到1937年,戈斯特因心脏病去世之前,健力士酒厂一直不知道戈斯特从事统计研究工作,并以“学生”笔名发表研究成果。许多统计研究者要和戈斯特见面,都必须像间谍电影般地秘密安排见面地点和时间。

  现在位于都柏林的健力士专卖店中有一个戈斯特的纪念碑,上面写著“化学家、统计学家威廉·希利·戈斯特,首席酿酒师,学生t检验”:

在这里插入图片描述

2. t检验的思路

  啤酒,主要原料是大麦,啤酒厂肯定是希望尽力提高亩产。

  比如,健力士公司有下面两块麦田:

在这里插入图片描述

  左边的麦田采用传统A工艺进行种植,平均每株大麦可以结100粒穗子。

  而右边的麦田采用改进过的B工艺种植,健力士公司想知道“B工艺是否提高了产量”。

  为了节约成本、减小损耗,抠门的健力士公司从B工艺的麦田中采样了5株大麦,样本均值为120粒穗子。然后把难题抛给了戈斯特。

  似乎直观看来产量提高了,毕竟均值增加了20%,可是戈斯特想得更多一些。

2.1 戈斯特的分析

  戈斯特提出一个假设检验

  假设:B工艺没有提高产量,即AB下的麦穗都是同一个分布

  检验:看看在此假设下, x ‾ = 130 \overline{x}=130 x=130发生的概率高不高。

  已知的数据是,A工艺下的单株麦穗的个数服从 μ = 100 \mu=100 μ=100,标准差 σ \sigma σ未知的正态分布:

X ∼ N ( μ , σ 2 ) X \sim N(\mu , \sigma^2) XN(μ,σ2)

  而B工艺下的麦田的样本均值 x ‾ = 120 \overline{x}=120 x=120,采样了5株。

  不同的标准差对应的正态分布图像不同:

在这里插入图片描述

  图像的跨度由标准差 σ \sigma σ决定:

在这里插入图片描述

  X如果服从以下正态分布:

X ∼ N ( μ , 2 ) X \sim N(\mu , 2) XN(μ,2)

   σ 2 = 2 \sigma^2=2 σ2=2,跨度不大,采样五个点使其 x ‾ = 120 \overline{x}=120 x=120的图像如下:

在这里插入图片描述

  可见, x ‾ = 120 \overline{x}=120 x=120的概率非常低,即AB下的麦穗是同一个分布的可能性不大,我们有很大把握可以认为B工艺真正提高了产量。

  而如果X服从的是跨度更大的正态分布,采样五个点使其 x ‾ = 120 \overline{x}=120 x=120的图像如下(为了演示,正态分布的参数选的不是很严谨):

在这里插入图片描述  这样的正态分布下, x ‾ = 120 \overline{x}=120 x=120的概率并不低,即AB下的麦穗还是可能为同一个分布的,我们没十足的把握认为B工艺提高了产量。

  因此,看起来不能单纯依靠 x ‾ − μ 0 \overline{x}-\mu_0 xμ0,或许除以样本标准差 可以消除跨度的影响:

x ‾ − μ 0 s \frac{\overline{x}-\mu_0}{s} sxμ0

  因为A工艺的 σ \sigma σ我们不清楚,但是我们假设AB同分布,所以直接使用了样本标准差s。

  当然,样本数n也会影响结果。比如说,在n=1000下,得到 x ‾ = 120 \overline{x}=120 x=120,那么根据大数定理,我们不用算了,基本上可以认为“B工艺提高了产量”。

  所以,戈斯特认为应该综合考虑样本均值 x ‾ \overline{x} x、样本方差s和样本数n,给出了一个统计量t值:

t = x ‾ − μ 0 s / n t=\frac{\overline{x}-\mu_0}{s/\sqrt{n}} t=s/n xμ0

  该统计量越大说明AB工艺导致的差别越大,越有可能说明“B工艺提高了产量”。

3. t分布

  对于t值:

t = x ‾ − μ 0 s / n t=\frac{\overline{x}-\mu_0}{s/\sqrt{n}} t=s/n xμ0

  对应的概率密度函数,也就是t分布为:

f ( t ) = Γ ( ( v + 1 ) / 2 ) v π Γ ( v / 2 ) ( 1 + t 2 / v ) − ( v + 1 ) / 2 f(t)=\frac{\Gamma((v+1)/2)}{\sqrt{v\pi}\Gamma(v/2)}(1+t^2/v)^{-(v+1)/2} f(t)=vπ Γ(v/2)Γ((v+1)/2)(1+t2/v)(v+1)/2

  其中v=n-1,也叫做自由度。而 Γ \Gamma Γ为伽马函数。

   f ( t ) f(t) f(t)接近于正态分布 N ( 0 , 1 ) N(0,1) N(0,1)(灰色虚线就是 N ( 0 , 1 ) N(0,1) N(0,1))下面是 v = 2 v=2 v=2的t分布:

在这里插入图片描述
  而t值,实际上对应的就是横坐标的值,比如说t值等于4:

在这里插入图片描述

  t=4之后的曲线下面积其实就是P值

image

  所以,我们知道t值之后,就可以根据 v = n − 1 v=n-1 v=n1以及要求的P值,查出当前的t值是否会拒绝我们的假设。

  举个例子,比如本文中的AB工艺下的数据为:

μ = 5 \mu=5 μ=5, n = 5 n=5 n=5, x ‾ = 120 \overline{x}=120 x=120 , s = 5 5 s=5\sqrt{5} s=55

  计算出来

t = x ‾ − μ 0 s / n = 120 − 100 5 5 / 5 = 4 t=\frac{\overline{x}-\mu_0}{s/\sqrt{n}}=\frac{120-100}{5\sqrt{5}/\sqrt{5}}=4 t=s/n xμ0=55 /5 120100=4

  服从 v = n − 1 = 4 v=n-1=4 v=n1=4的t分布:

在这里插入图片描述

  如果我们要求5%的显著水平的话,那么就可以拒绝“B工艺没有提高产量”这个假设了。


http://chatgpt.dhexx.cn/article/XM5n6FDn.shtml

相关文章

详解三大抽样分布:t分布、卡方分布、F分布

转载自https://www.cnblogs.com/think-and-do/p/6509239.html T分布:温良宽厚 本文由“医学统计分析精粹”小编“Hiu”原创完成,文章采用知识共享Attribution-NonCommercial-NoDerivatives 4.0国际许可协议(http://creativecommons.org/licenses/by-nc-…

几大分布:正态分布、卡方分布、t分布、F分布整理

一、正态分布 正态分布(Normal distribution)又名高斯分布(Gaussiandistribution),若随机变量X服从一个数学期望为μ、方差为σ2的高斯分布,记为N(μ,σ2)。其概率密度函数为正态分布的期望值μ…

数理统计三大分布:卡方分布、t分布、F分布

数理统计三大分布:卡方分布、t分布、F分布 正态分布卡方分布定义概率密度函数性质 t分布定义概率密度函数性质 F分布定义概率密度函数性质 Attention 正态分布 由于 χ 2 \chi^2 χ2(chi-squard)分布、t分布、F分布都是由正态分布构造的&…

卡方分布、F分布、t分布和正态分布的关系

这三个分布都是基于正态分布变形得到的,在实际中只能用来做假设检验。比如卡方分布(chi-square distribution, χ-distribution,或写作χ分布),已知样本X都是服从正态分布的样本,而且方差未知,那…

T 分布(近似标准正态分布)

1.1 定义 定义:假设X服从标准正态分布N(0,1),Y服从卡方分布,那么的分布称为自由度为n的t分布,记为。 T分布密度函数其中,Gam(x)为伽马函数。

关于t分布

上一篇文章提及了卡方分布,本文接着介绍另一类重要的抽样分布–t分布。 简单说一下背景,“t”,是Fisher为之取的名字。Fisher最早将这一分布命名为“Student’s distribution”,并以“t”为之标记。Student,则是William Sealy Gosset(戈塞特)的笔名。他当年在爱尔兰都柏…

三大抽样分布:卡方分布,t分布和F分布

卡方分布 定义: 用途 卡方检验:卡方检验主要用于分类变量之间的独立性检验 基本思想:卡方表示观察值与理论值之间的偏离程度。 相关性质 t分布 定义: 应用: t -分布(t-distribution)用于根据…

如何理解t检验、t分布、t值?

t检验、t分布、t值其实都是同一个数学概念中的不同部分。 1 t检验的历史 阿瑟健力士公司(Arthur Guinness Son & Co.)是一家由阿瑟健力士(Arthur Guinness)于1759年在爱尔兰都柏林建立的一家酿酒公司: 不过它最出…

elementui 级联选择器的用法

1.级联选择器的html结构&#xff1a; <!-- 添加分类的对话框 --><el-dialog title"添加分类" :visible.sync"addCateDialogVisible" width"50%" close"addCateDialogClosed"><!-- 添加分类的表单 --><el-form :m…

级联、并联和反馈系统

通过查阅相关资料&#xff0c;对级联、并联和反馈系统进行学习&#xff0c;主要通过等效函数和等效系统方框图来进行相关介绍。&#xff08;文中图片来自于自动控制网&#xff09; 1、级联系统 等效函数为&#xff1a; 等效框图为&#xff1a; 2、并联系统 等效函数为&…

Vue级联选择器

后端&#xff1a;后端返回的结果格式res如下 [{"value": zhinan,"label": 指南,"children": [{"value": shejiyuanze,"label": 设计原则,"children": [{"value": yizhi,"label": 一致}, {&qu…

级联选择框

文章目录 实现级联选择框效果图实现前端工具版本添加依赖main.js导入依赖级联选择框样式 后端数据库设计 实现级联选择框 效果图 实现 前端 工具版本 node.js v16.6.0vue3 级联选择框使用 Element-Plus 实现 添加依赖 在 package.json 添加依赖&#xff0c;并 npm i 导入…

Oracle数据库中的级联查询、级联删除、级联更新操作教程

这里整理了Oracle中的三种级联操作,其中Oracle定义外健的时候可以定义级联删除,但是没有级联修改的语法,当然可以用触发器实现,下面我们详细来看Oracle数据库中的级联查询、级联删除、级联更新操作教程 级联查询 在ORACLE 数据库中有一种方法可以实现级联查询 select * //…

级联网络

目录 级联 mtcnn级联人脸检测网络 级联 级联&#xff08;cascade&#xff09;在计算机科学里指多个对象之间的映射关系&#xff0c;建立数据之间的级联关系提高管理效率 中文名 级联 外文名 Cascade 类 型 映射关系 另 指 用来设计一对多关系 重复性的操作十…

信息级联(Information cascade)

文章目录 一、信息级联的定义1.1 信息级联的两步过程 二、基本模型三、文献Review3.1 信息级联起源的相关描述文献 四、相关资料提供 一、信息级联的定义 信息瀑布&#xff0c;又称信息级联。描述了当人们的选择受到前人信息的影响&#xff0c;放弃自己喜好&#xff0c;追随前…

级联相关网络

文章转自https://blog.csdn.net/xc_xc_xc/article/details/53163478 介绍 一般的神经网络是固定好拓扑结构&#xff0c;然后训练权重和阈值。级联相关神经网络是从一个小网络开始&#xff0c;自动训练和添加隐含单元&#xff0c;最终形成一个多层的结构。 级联相关神经网络具…

交换机——级联、堆叠和集群

交换机的连接主要有三种方式&#xff0c;级联方式、堆叠方式和集群方式。级联方式实现简单&#xff0c;只需一根普通的双绞线即可&#xff0c;节约成本而且基本不受距离的限制。而堆叠方式投资相对较大&#xff0c;且只能在很短的距离内连接&#xff0c;实现起来比较困难。集群…

一张图彻底理解级联!!!!!

1 学生表中肯定包含多条记录 每一条记录代表一名学生 因为 每一条记录保存了一名学生的核心信息: 该学生的姓名,性别,学生证号 但是 学生表中必须给每一条记录一个编号id 为什么 就是为了级联!!! 事实上 每个表我们都会倾向于给一个编号id 为什么? 为了…

级联

2019独角兽企业重金招聘Python工程师标准>>> 级联,英语:Cascade。是计算机科学里比较常见的概念。通常是指多个对象按照一定的规则有级别地或者是有梯度地联接在一起,也就是按照树形结构有层次地把对象组织在一起。 ■应用: 级联的应用比较广泛,表现在很多方…

级联介绍与实践

级联介绍与实践 一、级联的介绍和理解 1、级联概念 下面是百度百科对级联的解释和理解&#xff1a; 概念&#xff1a;级联&#xff08;cascade&#xff09;在计算机科学里指多个对象之间的映射关系&#xff0c;建立数据之间的级联关系提高管理效率 理解&#xff1a;级联还…