非参数检验之符号检验、Wilcoxon符号秩检验、游程检验

article/2025/9/14 23:38:59

目录

一、符号检验

例2.1下面是世界上71个大城市的花费指数(包括租金)按递增次序排列如下(这里上海是44位,其指数为63.5):

R代码:

二、Wilcoxon符号秩检验

例2.3下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数(单位:升).数据已经按照升幂排列.

R代码:

三、游程检验

R代码:


一、符号检验

广义符号检验是对连续变量π分位点 xn 进行的检验,而狭义的符号检验则是针对中位数M= Q0.5

进行的检验。

例2.1下面是世界上71个大城市的花费指数(包括租金)按递增次序排列如下(这里上海是44位,其指数为63.5):

27.8 27.8 29.1 32.2 32.7 32.7 36.4 36.5 37.5 37.7 38.8 41.9 45.2 45.8 46 47.6 48.2 49.9 51.8 52.7 54.9 55 55.3 55.5 58.2 60.8 62.7 63.5 64.6 65.3 65.3 65.3 65.4 66.2 66.7 67.7 71.2 71.7 73.9 74.3 74.5 76.2 76.6 76.8 77.7 77.9 79.1 80.9 81 82.6 85.7 86.2 86.4 89.4 89.5 90.3 90.8 91.8 92.8 95.2 97.5 98.2 99.1 99.3 100 100.6 104.1 104.6 105 109.4 122.4

请检验以下问题:

(1)有人说64是中位数(样本中位数为67.7,大于64)

(2)有人说64是下四分位数(样本下四分位数为50.85,小于64)

回答如下

若想知道样本下四分位点 Q_{0.25}是否小于64的检验.形式上,我们的检验是:

H0:Q_{0.25}=64\Leftrightarrow H1:Q_{0.25}<64

(1)这里的64就是q_{0}.按照零假设,小于64的样本点个数Q_{0.25}S^-的实现值s^-应该大约占样本的1/4,或者S^-服从Bin(n,0.25)分布.如果偏离得太远,就有问题了.容易算出S^-=28,s^+=43和n=s^-+s^+=71.根据上面的说明,对于这个例子,p值=1-P_{H0}(K≤s^--1)=1-P_{H0}(K≤28-1)=1-P_{H0} (K≤27)≈0.00515.因此,可以对于显著性水平α=0.01,拒绝零假设,即下四分位点Q_{0.25}应该小于64.再看关于64是否为中位数的检验,

 

 

 

H_0:M(=Q__{0.5})=M_0\Leftrightarrow H_1:M>64

(2)同样,s^-=28, s^+=43n=s^-+s^+=71.但是这里涉及的零假设下的分布为Bin(71,0.5),而不是刚才的Bin(71,0.25).取k=min(s^-,s^+)=28,p值=。(K≤k)=(K≤28) ≈0.04796.

R代码:

sign.test=function(x,p,M0)   #x为数据,p为分位数,M0为待检验的的数
{s1=sum(x<M0);s2=sum(x>M0);n=s1+s2
p1=pbinom(s1,n,p);p2=1-pbinom(s1-1,n,p)
if (p1>p2) m1="H0: M>=M0"
else m1="H0: M<=M0"
p.value=min(p1,p2);p.value2=2*p.value
list(c("s+"=s2,"s-"=s1,"n'"=n),c("原假设"=m1,"单边p值"=p.value,"双边p值"=p.value2))
}
setwd("C:/Users/Lenovo/Desktop/data")
x1<-read.table("ExpensiveCities.TXT",sep=" ")
sign.test(x1,0.5,64)
sign.test(x1,0.25,64)

代码运行结果:

二、Wilcoxon符号秩检验

在Wilcoxon符号秩检验中,它把观测值和零假设的中心位置之差的绝对值的秩分别按照不同的符号相加作为其检验统计量。它适用于T检验中的成对比较,但并不要求成对数据之差di服从正态分布,只要求对称分布即可。检验成对观测数据之差是否来自均值为0的总体(产生数据的总体是否具有相同的均值)。

例2.3下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数(单位:升).数据已经按照升幂排列.

4.12 5.81 7.63 9.74 10.39 11.92 12.32 12:89 13.54 14.45

人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,我们希望用上述数据来检验这种看法.

解题过程:

设即零假设为:对上述数据的计算得到中位数为因此,我们的备选假设为:符号秩检验步骤如下:设M_{0}=8,即零假设为H0:M=8.对上述数据的计算得到中位数为11.160.因此,我们的备选假设为H1:M>8.Wilcoxon符号秩检验步骤如下:

(1)对计算,它们代表这些样本点到的距离,对于例数据,则计算,得到、、、、、、、、、(1)对i=1,…,n,计算|X_iM_{0}l,它们代表这些样本点到M0的距离,对于例2.3数据,则计算|X_i−8|,i=1,…,10,得到:

3.88、2.19、0.37、1.74、2.39、3.92、4.32、4.89、5.54、6.45.

(3)把上面的n个绝对值排序,并找出它们的n个秩.如果有相同的样本点,每个点取平均秩.对于例2.3数据,这些秩为5、3、1、2、4、6、7、8、9、10

(3)令W^+等于X_i-M_0>0|X_i-M_0|的秩的和.而W−等于X_i-M_0<0|X_i-M_0|的秩的和.注意:W^++W^-=n(n+1)/2.对于例2.3数据,加上符号的秩为−5、−3、−1、2、4、6、7、8、9、10

因此,W^+=2+4+6+7+8+9+10=46W^-=5+3+1=9.

(4)对双边检验H_0...M=M_0\Leftrightarrow H_1...M\neq M_0,在零假设下,W+和W−应差不多,因而,当其中之一很小时,应怀疑零假设,在此,取检验统计量W=min(W^+,W^-).类似地,对于单边检验H_0...M\leqslant M_0\Leftrightarrow H1...M>M_0,取W=W^-,对单边检验:H_0...M\geqslant M_0\Leftrightarrow H1...M<M_0,取W=W^+.对于例2.3的问题,取W=W^-=9.

(5)根据得到的W值,利用统计软件或查Wilcoxon符号秩检验的分布表以得到在零假设下的p值.得到p值为0.032.

(6)如果p值较小(比如小于或等于给定的显著性水平,譬如0.05)则可以拒绝零假设.如果p值较大则没有充分证据来拒绝零假设,但不意味着接受零假设.对于例2.3的问题,如果给定α=0.05,由于p值(=0.032)小于α,我们可以拒绝零假设,认为欧洲人均酒精年消费多于8升.

R代码:

y<-c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45)
wilcox.test(y-8,alt="greater")
wilcox.test(y-12.5,alt="less")
walsh=NULL;for(i in 1:10)for(j in i:10)
walsh=c(walsh,(y[i]+y[j])/2);walsh=sort(walsh)
qsignrank(0.025,10)

代码运行结果如下:

三、游程检验

游程检验亦称“连贯检验”,是根据样本标志表现排列所形成的游程的多少进行判断的检验方法。 游程检验是一种非参数性统计假设的检验方法,它是游程总数检验和最大游程检验的总称,用于两个独立样本的比较和观测结果随机性的检验测试。

游程检验检验问题可以表达为:

数据出现顺序随机数据出现顺序随机H_0数据出现顺序随机⇔H_1数据出现顺序随机

例2.6如在工厂的全面质量管理中,生产出来的20个工件的尺寸按顺序为(X_1,…,X_{20})(单位cm)12.27、9.92、10.81、11.79、11.87、10.90、11.22、10.80、10.33、9.30、9.81、8.85、9.32、8.67、9.32、9.53、9.58、8.94、7.89、10.77人们想要知道生产出来的工件的尺寸变化是否只是由于随机因素,还是有其它非随机因素.

解题过程:

先找出它们的中位数为X_{med=9.865,再把大于X_{med的记为1,小于的记为0,于是产生一串1和0: 

1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1

也就是说,变成了前面的情况.这时R=3,m=n=10而按照上面的公式(只要算两项),P(R<=3) =P(R=2)+P(R=3)=0.00006即p值为0.0001.于是可以在水平a>0.0001时拒绝零假设.这里,算的是P(R<=3)而不是P(R>=3)是因为显然R=3离最小可能的值2要比最大可能的值20要近,因此可以说,在生产过程中有非随机因素起作用。

根据我们的R程序得到精确的双边检验的p值为0.00012,而相应的渐近的p值为0.00024.精确的p值和渐近p值差别较大,显然,这源于样本量不够大。

R代码:

run.test=function(y,cut=0){ if(cut!=0)x=(y>cut)*1 else x=y
N=length(x);k=1;for(i in 1:(N-1))if (x[i]!=x[i+1])k=k+1;r=k;
m=sum(1-x);n=N-m;
P1=function(m,n,k){2*choose(m-1,k-1)/choose(m+n,n)*choose(n-1,k-1)}
P2=function(m,n,k){choose(m-1,k-1)*choose(n-1,k)/choose(m+n,n)+choose(m-1,k)*choose(n-1,k-1)/choose(m+n,n)}
r2=floor(r/2);if(r2==r/2){pv=0;for(i in 1:r2) pv=pv+P1(m,n,i);
for(i in 1:(r2-1)) pv=pv+P2(m,n,i)} else {pv=0
for(i in 1:r2) pv=pv+P1(m,n,i)
for(i in 1:r2) pv=pv+P2(m,n,i)};if(r2==r/2)pv1=1-pv+P1(m,n,r2) else pv1=1-pv+P2(m,n,r2);
z=(r-2*m*n/N-1)/sqrt(2*m*n*(2*m*n-m-n)/(m+n)^2/(m+n-1));
ap1=pnorm(z);ap2=1-ap1;tpv=min(pv,pv1)*2;
list(m=m,n=n,N=N,R=r,Exact.pvalue1=pv,Exact.pvalue2=pv1,Aprox.pvalue1=ap1, Aprox.pvalue2=ap2,Exact.2sided.pvalue=tpv,Approx.2sided.pvalue=min(ap1,ap2)*2)}
x=c(12.27,9.92,10.81,11.79,11.87,10.90,11.22,10.80,10.33,9.30,9.81,8.85,9.32,8.67,9.32,9.53,9.58,8.94,7.89,10.77)
x=as.matrix(x)#设置成矩阵数据
y=factor(sign(x-median(x)));run.test(x>median(x))

代码运行结果:


http://chatgpt.dhexx.cn/article/GeymFniu.shtml

相关文章

SPSS非参数检验

系列文章目录 SPSS描述统计 SPSS均值检验 SPSS方差分析 文章目录 系列文章目录前言1 非参数检验提出的背景与特点1.1 背景1.2 特点 2 SPSS分析-非参数检验菜单中的相关功能2.1 卡方检验2.1.1 概述2.1.2 操作流程2.1.3 实例操作 2.2 二项分布检验2.2.1 概述2.2.2 操作流程2.2.3…

入门必学 | R语言参数检验之t检验与方差分析

T检验与方差分析 背景介绍R语言实操过程--t test单样本t检验两个独立样本t检验配对t检验 R语言实操过程--anova单因素方差分析多重比较 双因素方差分析 完整代码 之前与大家分享了数据的独立性、正态性、方差齐性检验。如果还不清楚&#xff0c;大家可以通过这篇推文来学习和理…

R语言对数据进行非参数检验

假设检验&#xff1a;参数检验运用样本的统计量来估计总体的参数&#xff0c;如用样本均值估计总体均值&#xff0c;用样本标准差估计总体标准差。 非参数检验则不考虑数据的具体值&#xff0c;而更多地运用了数据大小排序的信息&#xff0c;因此不可能以此估计总体的参数 1.原…

SPSS参数检验、非参数检验、方差分析

参数检验、非参数检验、方差分析 1.导语2.参数检验2.1 数据分布2.1.1 正态分布1.有总体数据2.没有总体数据&#xff0c;用样本3.统计参数 2.1.2 指数分布1.有总体数据2.没有总体数据&#xff0c;样本3.统计参数 2.2 单样本t检验2.2.1 单样本t检验目的2.2.2 SPSS操作 2.3 两独立…

SPSS学习笔记(四)非参数检验

目录 一、配对&#xff1a;Wilcoxon符号-秩检验 分析 操作 结果及分析 二、独立样本&#xff1a;Mann-Whitney U检验 分析 操作 结果及分析 三、单因素ANOVA&#xff1a;Kruskal-Wallis检验 分析 操作 结果及分析 一、配对&#xff1a;Wilcoxon符号-秩检验 分析&a…

R语言非参数检验多重比较

本文首发于公众号&#xff1a;医学和生信笔记&#xff0c;完美观看体验请至公众号查看本文。 医学和生信笔记&#xff0c;专注R语言在临床医学中的使用&#xff0c;R语言数据分析和可视化。 之前介绍了多个样本均数的多重比较&#xff0c;今天说说kruskal-Wallis H检验后的多重…

什么是非参数检验?应该如何操作与分析?

检验问题可划分为两大类&#xff1a;参数检验和非参数检验&#xff0c;其中总体分布的具体函数形式的前提下&#xff0c;只是其中若干个参数未知称为参数检验&#xff0c;否则称为非参数检验。 一、研究场景 非参数检验用于研究定类数据与定量数据之间的关系情况。例如研究人…

【日常】矩阵正态分布参数检验问题

最近给凯爹做的一个苦力活&#xff0c;统计检验这个东西说实话也挺有趣&#xff0c;跟算法设计一样&#xff0c;好的检验真的是挺难设计的&#xff0c;就有近似算法的那种感觉&#xff0c;检验很难保证size和power都很理想&#xff0c;所以就要做tradeoff&#xff0c;感觉这个假…

参数估计与假设检验

推断统计&#xff1a;研究如何利用样本数据来推断总体特征 描述统计&#xff1a;描述一组数据的特征 参数估计&#xff1a;利用样本信息估计总体特征 假设检验&#xff1a;利用样本信息判断对总体的假设是否成立 一.参数估计 就是对于总体指标的估计 估计&#xff1a;根据…

第4章 Stata参数检验

目录 4.1单一样本T检验 案例延伸 4.2独立样本T检验 案例延伸 1.改变置信水平 2.在异方差假定条件下进行假设检验 4.3配对样本T检验 案例延伸 1.改变置信水平 4.4单一样本方差的假设检验 案例延伸 4.5双样本方差的假设检验 参数检验&#xff08;Parameter Test&…

非参数检验——Wilcoxon 检验 Friedman 检验与 Nemenyi 后续检验

最近看论文&#xff0c;看到了Wilcoxon signed-rank test&#xff08;符号秩检验&#xff09;&#xff0c;咱也不知道是个啥&#xff0c;就学习了一下&#xff0c;这里做一下笔记&#xff0c;方便以后查阅。 非参数检验——Wilcoxon 检验 非参数检验概念非参数检验和参数检验的…

SPSS之“参数检验”

目录 简介单样本t检验两独立样本t检验两配对样本t检验 简介 <!-主要作为个人的笔记&#xff0c;和操作步骤的查询-->参数检验(比价均值)是根据样本数据推断总体特征的方法。这种推断通常在以下两种情况下进行&#xff1a;参数检验&#xff1a;总体分布(多为正态分布)已知…

参数检验和非参数检验(结合SPSS分析)

文章目录 假设检验参数检验平均值检验单样本t检验两独立样本t检验配对样本t检验 非参数检验卡方检验单样本K-S检验两独立样本的非参数检验多个独立样本的非参数检验两配对样本检验多匹配样本的非参数检验 假设检验 概念&#xff1a;是一种根据样本数据来推断总体的分布或均值、…

参数与非参数检验:理解差异并正确使用

数据科学是一个快速发展的领域&#xff0c;它在很大程度上依赖于统计技术来分析和理解复杂的数据集。这个过程的一个关键部分是假设检验&#xff0c;它有助于确定从样本中获得的结果是否可以推广到总体。 在这篇文章中&#xff0c;我们将探讨参数与非参数检验之间的区别&#…

SPSS-参数检验

1. 假设检验 假设检验分为参数检验与非参数检验。 &#xff08;1&#xff09; 参数检验&#xff1a;已知总体分布, 猜测总体的某参数(原假设H0&#xff0c;null hypothesis)&#xff0c;用一组样本来检验这个假设&#xff0c; 是否正确 (即接受还是拒绝假设H0)。 &#xff0…

参数检验和非参数检验

一、参数检验 1、基本思想 2、两类错误 3.、检验步骤 4、检验的p值 在一个假设检验问题中, 拒绝原假设H0的最小显著性水平称为检验的p值. 5、单正态总体参数的检验 &#xff08;1&#xff09; &#xff08;2&#xff09; &#xff08;3&#xff09; 6、两正态总体参数的检…

数据分析之参数检验与非参数检验

1、参数检验和非参数检验的区别 定义不同&#xff1a; 参数检验&#xff1a;假定数据服从某分布&#xff08;一般为正态分布&#xff09;&#xff0c;通过样本参数的估计量&#xff08;xs&#xff09;对总体参数&#xff08;μ&#xff09;进行检验&#xff0c;比如t检验、u检…

常用的参数检验和非参数检验方法对比

目录 一、基本概念 二、对比 三、具体方法对比 1、参数检验 2、非参数检验 一、基本概念 参数检验是在总体分布形式已知的情况下&#xff0c;对总体分布的参数如均值、方差等进行推断的方法。但是&#xff0c;在数据分析过程中&#xff0c;由于种种原因&#xff0c;我们往…

STM32中断优先级的分配以及中断原则

STM32d的中断优先级由NVIC_IPRx寄存器来配置&#xff0c;IPR的宽度为8bit所以原则上每个中断可配置的优先级为0~255&#xff0c;数值越小优先级越高&#xff0c;但对于大部分的 Cortex-M3芯片都会精简设计&#xff0c;导致实际上支持的优先级数量更少。在STM32中只使用了IPR寄存…