目录
一、前言
二、假设检验的基本概念
1.假设检验的概念与目的:
2.原假设
三、假设检验的实例步骤:
例子:
一个问题:
四、不同种类的假设检验:
one-sample T检验:
Two-sample T检验:
(1)Matched Pairs 匹配成对检测
(2)Unmatched Pairs
One-tail 测试(单侧检验):
two-tail检测(双侧检验)
一、前言
这一节来说一说假设检验,这是一个在统计学,量化领域很重要的一个概念。那么《统计推断基础》这个系列主章节主要是5部分,分别是:
- 总体、样本、标准差、标准误【定量分析、量化金融与统计学】统计推断基础(1)---总体、样本、标准差、标准误
- 样本均值分布、中心极限定理、正态分布【定量分析、量化金融与统计学】统计推断基础(2)---样本均值分布、中心极限定理、正态分布
- 点估计、区间估【定量分析、量化金融与统计学】统计推断基础(3)---点估计、区间估计
- 假设检验
- I型误差,II型误差
之后还会有一些番外来详细说一些其他的问题。
还是那句话,重点在基础概念,基础不牢,地动山摇,不关你是做研究还是本科基础学习阶段,基础都是很重要的。
二、假设检验的基本概念
1.假设检验的概念与目的:
假设检验是估计的延伸。
假设检验的目的是利用证据拒绝假设。我们不是要证明或证实假设。你的目的是拒绝,不是肯定。所以这将会影响到之后原假设的设计。
因此,只有当我们能够成功地拒绝假设时,我们才能得到有意义的结论。
例如:
糖果产品的包装袋上写着“每包平均含有50块水果咀嚼片”。
作为消费者,你想要挑战这种说法。如何建立一个有数据支持的案例?
那么这就是一个假设检验问题。
就是有一个人说了一个观点,你觉得不靠谱,想要推翻他,然后你通过假设检验,数据分析的方法得到了证据,于是你拒绝了这个观点。
所以假设检验是反证思想。
2.原假设
原假设(null hypothesis)就是你想要去拒绝的那个观点,一般记作H0。
三、假设检验的实例步骤:
例子:
糖果产品的包装袋上写着“每包平均含有50块水果咀嚼片”。
作为消费者,你想要挑战这种说法。如何建立一个有数据支持的案例?
那么在这个例子中,你的原假设是µ = 50,所以H0:µ = 50
(1)明确假设:
H0:µ = 50
H1:µ ≠ 50
(2)确定非拒绝范围:
我们的默认非拒绝概率是95%,也就是说有95%的概率接受H0,此时的我们的偏差范围是±1.96SE
(3)确定错误概率
当我们计算后,发现这个值并不在非拒绝范围内,那么这就是错误概率,那么错误概率=1-非拒绝概率,这种错误发生的概率称为“α”。
α决定了错误拒绝真假设的最大概率。
(4)计算样本平均值和样本的标准差(SD)
假设我们计算出来是这样的:
n = 30(样本容量)
(5)计算标准误(SE)
(6)计算非拒绝域
(7) 下结论:
因为非拒绝域中不包含样本的均值52.4,所以我们拒绝接受H0,“每包水果的平均咀嚼次数不太可能是50个”。
一个问题:
为什么不在范围内就拒绝了?
我们来直观理解一下,我们设定的置信域为95%的情况下,也就是说样本的均值有95%的概率落在范围为48.783~51.217内,错误的概率只由5%,错误的概率很小了,但是很可惜,即使这么小的错误概率也发生了,52.4落在了范围之外,也就是说,“本来不可能发生的小概率事件发生了”,那么我们就可以说,你这个结论是假的,因为发生了小概率的事件。
四、不同种类的假设检验:
one-sample T检验:
只取1个样本作为证据(这个信息通常是给定的)检验叫做One-sample,刚刚的糖果例子就是one-sample。
Two-sample T检验:
(1)Matched Pairs 匹配成对检测
你的两组应该是成对的(通常是同一组的两个观察值)。
例如:
观察100个人的体重。
你需要观察同一组人不同时间的体重值。
用图像形容就是:(Z-test与T-test没有本质区别,Z适用于更大样本,T适用于小样本)
什么时候用?
- 你想知道一组中的两个测量值在您感兴趣的变量上是否不同
- 感兴趣的变量是连续的
- 有两个且只有两个组(即来自单个组的两个测量值)
- 有配对样本
- 有一个正态的感兴趣变量(和总体方差已知)
(2)Unmatched Pairs
例如:两组人在1个月的体重(平均)下降有显著差异吗?
就是完全的两组,并不是一组人。
和上一个对比理解。
注意:不匹配成对测试计算SE的时候需要用以下公式:
One-tail 测试(单侧检验):
例如:所有11岁孩子的平均身高是
- 至少:110cm
- 至多:110cm
- 大于:110cm
- 小于:110cm
1-tail 的假设样子如下:
注意:1-tail再计算比例的时候:
如果α = 5%那么就是单侧为5%不是2.5%
two-tail检测(双侧检验)
双尾假设总是定义为:
- H0中是一个等式
- H1中是一个不等式
例如:糖果问题:
H0:µ = 50
H1:µ ≠ 50
检测时因为是双尾,所以需要除以2,例如错误率为5%,那么你查表时就要查2.5%对应的Z值。
我们之后会专门出一个例题番外来详细介绍各个类别如何分析。