【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z检验)

article/2024/9/7 19:33:49

目录

一、前言

二、假设检验的基本概念

1.假设检验的概念与目的:

2.原假设

三、假设检验的实例步骤:

例子:

一个问题:

四、不同种类的假设检验:

one-sample T检验:

Two-sample T检验:

(1)Matched Pairs 匹配成对检测

(2)Unmatched Pairs

One-tail 测试(单侧检验):

 two-tail检测(双侧检验)


一、前言

这一节来说一说假设检验,这是一个在统计学,量化领域很重要的一个概念。那么《统计推断基础》这个系列主章节主要是5部分,分别是:

  1. 总体、样本、标准差、标准误【定量分析、量化金融与统计学】统计推断基础(1)---总体、样本、标准差、标准误
  2. 样本均值分布、中心极限定理、正态分布【定量分析、量化金融与统计学】统计推断基础(2)---样本均值分布、中心极限定理、正态分布
  3. 点估计、区间估【定量分析、量化金融与统计学】统计推断基础(3)---点估计、区间估计
  4. 假设检验
  5. I型误差,II型误差

之后还会有一些番外来详细说一些其他的问题。

还是那句话,重点在基础概念,基础不牢,地动山摇,不关你是做研究还是本科基础学习阶段,基础都是很重要的。
 

二、假设检验的基本概念

1.假设检验的概念与目的:

假设检验是估计的延伸。

假设检验的目的是利用证据拒绝假设。我们不是要证明或证实假设。你的目的是拒绝,不是肯定。所以这将会影响到之后原假设的设计。

因此,只有当我们能够成功地拒绝假设时,我们才能得到有意义的结论。

例如:

糖果产品的包装袋上写着“每包平均含有50块水果咀嚼片”。
作为消费者,你想要挑战这种说法。如何建立一个有数据支持的案例?

那么这就是一个假设检验问题。

就是有一个人说了一个观点,你觉得不靠谱,想要推翻他,然后你通过假设检验,数据分析的方法得到了证据,于是你拒绝了这个观点。

所以假设检验是反证思想。

2.原假设

原假设(null hypothesis)就是你想要去拒绝的那个观点,一般记作H0。

三、假设检验的实例步骤:

例子:

糖果产品的包装袋上写着“每包平均含有50块水果咀嚼片”。
作为消费者,你想要挑战这种说法。如何建立一个有数据支持的案例?

那么在这个例子中,你的原假设是µ = 50,所以H0:µ = 50

(1)明确假设:

H0:µ = 50

H1:µ ≠ 50

(2)确定非拒绝范围:

我们的默认非拒绝概率是95%,也就是说有95%的概率接受H0,此时的我们的偏差范围是±1.96SE

 (3)确定错误概率

当我们计算后,发现这个值并不在非拒绝范围内,那么这就是错误概率,那么错误概率=1-非拒绝概率,这种错误发生的概率称为“α”。

α决定了错误拒绝真假设的最大概率。

(4)计算样本平均值和样本的标准差(SD)

假设我们计算出来是这样的: 

n = 30(样本容量)

(5)计算标准误(SE)

(6)计算非拒绝域

 

(7) 下结论:

因为非拒绝域中不包含样本的均值52.4,所以我们拒绝接受H0,“每包水果的平均咀嚼次数不太可能是50个”。

一个问题:

为什么不在范围内就拒绝了?

我们来直观理解一下,我们设定的置信域为95%的情况下,也就是说样本的均值有95%的概率落在范围为48.783~51.217内,错误的概率只由5%,错误的概率很小了,但是很可惜,即使这么小的错误概率也发生了,52.4落在了范围之外,也就是说,“本来不可能发生的小概率事件发生了”,那么我们就可以说,你这个结论是假的,因为发生了小概率的事件。

四、不同种类的假设检验:

one-sample T检验:

只取1个样本作为证据(这个信息通常是给定的)检验叫做One-sample,刚刚的糖果例子就是one-sample。

Two-sample T检验:

(1)Matched Pairs 匹配成对检测

你的两组应该是成对的(通常是同一组的两个观察值)。

例如:

观察100个人的体重。

你需要观察同一组人不同时间的体重值。

用图像形容就是:(Z-test与T-test没有本质区别,Z适用于更大样本,T适用于小样本)

什么时候用?

  1. 你想知道一组中的两个测量值在您感兴趣的变量上是否不同
  2. 感兴趣的变量是连续的
  3. 有两个且只有两个组(即来自单个组的两个测量值)
  4. 有配对样本
  5. 有一个正态的感兴趣变量(和总体方差已知)

(2)Unmatched Pairs

例如:两组人在1个月的体重(平均)下降有显著差异吗?

就是完全的两组,并不是一组人。

和上一个对比理解。

注意:不匹配成对测试计算SE的时候需要用以下公式:

 

One-tail 测试(单侧检验):

例如:所有11岁孩子的平均身高是

  1. 至少:110cm
  2. 至多:110cm
  3. 大于:110cm
  4. 小于:110cm

1-tail 的假设样子如下:

注意:1-tail再计算比例的时候:

 如果α = 5%那么就是单侧为5%不是2.5%

 two-tail检测(双侧检验)

双尾假设总是定义为:

- H0中是一个等式

- H1中是一个不等式

例如:糖果问题:

H0:µ = 50

H1:µ ≠ 50

检测时因为是双尾,所以需要除以2,例如错误率为5%,那么你查表时就要查2.5%对应的Z值。

我们之后会专门出一个例题番外来详细介绍各个类别如何分析。


http://chatgpt.dhexx.cn/article/vpNULX21.shtml

相关文章

【数学➡️量化】两个必须知道的金融中的数学应用!!

引言 相信如果是数学系的本科生,想工作向量化转行的这个路上难免遇到许多的“水土不服”——怀疑自己的数学是否能派上用场,一边觉得自己论应用比不过金工的同学,一边觉得论编程比不过计算机的同学… 但其实,不用怀疑自己&#x…

金融计量模型(三):工具变量法

文章目录 工具变量法内生性Simultaneous causality案例:供求问题 Omitted VariablesErrors in Variables其他原因 工具变量法的基本想法多个工具变量 工具变量法 内生性 在线性回归: y i x i ′ β u i y_ix_i\betau_i yi​xi′​βui​ 中&#xf…

高级计量经济学(part1)--什么是计量经济学

学习笔记,仅供参考,有错必纠 参考自:陈强. 高级计量经济学[M]. 什么是计量经济学 顾名思义,”计量经济学" ( E conometrics, 也译为“ 经济计量学)就是运用概率统计的方法对经济变量之间的(因果)关系…

【定量分析、量化金融与统计学】统计推断基础(1)---总体、样本、标准差、标准误

目录 一、前言 二、总体与样本 1.总体(population)的概念 2.总体的性质与参数 首先是:平均数(mean) 标准差(standard deviation,SD)σ希腊字母sigma 3.样本(sample…

【精算研究01/10】 计量经济学的性质和范围

一、说明 计量经济学是使用统计方法来发展理论或测试经济学或金融学中的现有假设。计量经济学依赖于回归模型和零假设检验等技术。计量经济学也可以用来预测未来的经济或金融趋势。 图片来源:https://marketbusinessnews.com 二、 计量经济之简介 计量经济学是对经济…

信息计量学

目录 第一章 绪论 1.1由来和发展 1.1.1产生背景 1.2概念和内容体系 1.2.1 概念 1.2.2内容体系 1.3与相关学科 1.3.1与数学 1.3.2与文献计量学 1.3.3与科学学 1.4发展趋势和前景 1.4.1进展 1.4.2趋势 第二章 文献信息增长规律 2.1 文献信息流的特性及增长规律研究…

统计学在金融中的应用

统计分析是在一堆独立的、自身没有实际意义的数据中寻找可能存在的趋势、分布、概率等有意义的信息。统计学的目标是探索和把握数据内在的规律。统计学的应用,简单来说就是通过搜集相关数据并进行整理和分析,然后根据数据做出决策。掌握统计学&#xff0…

【定量分析、量化金融与统计学】多元回归模型与回归推理

之前说过了一元线性回归并给出了程序,今天来说说多元回归模型(Multiple Regression Model) 目录 一、多元回归模型的简介 二、求解多元回归模型:我们使用最小二乘法为例 三、评判方法 四、推理和回归 五、模型的优化 1.排…

金融计量学实验报告一

一、实验数据 中国石油天然气集团公司是以油气业务、工程技术服务、石油工程建设、石油装备制造、金融服务、新能源开发等为主营业务的综合性国际能源公司能源公司(代码601857), 数据来源中国石油上市公司在2011/1月到2021/12月的月度收盘价数据,数据来源为大智慧软件下载并…

金融计量学1

第一题 请使用 sysuse nlsw88.dta, clear 命令调入 Stata 数据文件 nls88.dta, 并完成如下统计分析: (1). 统计如下变量的平均值、标准差、中位数、最小值和最大值,并列表呈现出来,并输出为 Excel 或 Word 文档,名称为 Table01.xlsx 或 Table01.docx: age grade wage ho…

金融计量学第2课堂-金融时间序列线性模型

量化策略开发,高质量社群,交易思路分享等相关内容 一、相关性和平稳性 1、相关性 (1)皮尔森相关系数 皮尔森相关系数是最常见、最常用的一个相关系数计算方法。作为衡量两个随机变量x和y线性相关程度的重要指标,在这…

【金融计量学】面板数据(自用笔记,第一次写)

一、简介 面板数据的分类:平衡/非平衡面板数据;动态/静态面板数据。 面板数据中包含两种效应: 1. 个体效应:不随时间推移而明显变化的因素,如消费者的收入、产品的价格、个人消费习惯、社会制度等。 2. 时间效应&#…

金融计量学第1节课:股指收益率序列统计特征

量化策略开发,高质量社群,交易思路分享等相关内容 导论与介绍 大家好,我是Le Chiffre 今天我们来为大家分享金融计量学系列内容,在松鼠量化3年多分享的内容中,大部分以量化策略为主,至今为止,…

Word可折叠多级标题

在修改文章格式时应按照期刊的格式规范,如要使用可折叠的多级标题时,可参考如下方法。 1、规范下图的标题 2、按图顺序点击相应按钮,新建样式 3、依次修改红圈内容。注意:如果是一级标题,相应地,样式基准…

word文档如何设置多级标题

1、设置一级标题 光标放在‘一级标题’内容那,点击‘标题1’ 点击‘多级列表’图标 选中一个列表样式 一级标题设置完毕 当再次设置一级标题的时候,可以通过选中已经设置好的一级标题,然后点击‘格式刷’将样式复制 2、设置二级标题…

处理word 多级标题编号不联动的问题

修改文档时遇到的问题,各种百度没有解决,后来领导指导下弄好了,做个纪录。 问题如下所示 解决办法:需要在开始-多级编号处,将2级标题与3级标题设置成同一样式。 接下来开始演示 目前2级标题是这个样式 3级标题是这…

Mac Office Word设置多级标题

目录 定义新的多级列表 将级别链接到样式 问题解决:在样式中没有对应标题 附:毕业论文格式搞一手 定义新的多级列表 在一个新建文档中,点击顶栏中的多级列表标志,选择定义新的多级列表 注:如果找不到这个符号&…

【WORD】01 多级标题自动编号

需求 在Word中,希望实现多级标题,自动编号,改变章节顺序后,自动改变章节编号这一功能。经过搜索后,摸索出设置方法,设置效果如图。 操作步骤 首先明确标题样式,如图所示 点击段落–>多级…

从根儿上解决Word中标题多级标题编号不联动问题

在日常工作中总是时不时会出现word标题编号相关的问题,不胜其烦。最近终于有时间去排查,找出了解决办法。 以下为我个人总结出的两个问题,如果大家也曾经被困扰过,希望能帮到你们。 一、多余编号 大家请看下图: 如果…

Word文档多级标题设置

1 标题a1 1.1 标题a2 1.1.1 标题a31 1.1.2 标题a32 2 标题b1 2.1 标题b2 2.1.1 标题b31 2.1.2 标题b32 想要标题如上呈现,且二级、三级标题随着上一级标题编号变动操作如下 选中“标题a1”点击定义新的多级列表 上述操作完成后点击确定然后将标题名设置相应的标题…