相关性分析
相关性分析的检验衡量指标包括:Pearson相关系数、Spearman相关系数、Kendall相关系数、偏相关系数、多分格相关系数、多系列相关系数
默认使用Pearson相关系数
cor(data)
#或者
cor(x,y,method = c(“pearson”, “kendall”, “spearman”))
#x,y可以是两组数据,例如来自同一个表格中截取的不同列
除此之外,还可以使用
cov(data)
用来计算协方差,用来衡量两个变量之间的总体误差,反应的问题实际上是与cor()是一致的
另外ggm包中的pcor()函数用来计算偏相关性函数
偏相关性是指,在控制一个或多个变量时其他变量之间的相关关系
这个表示在控制2,3,6列(Income 、Illiteracy、HS Grad)的情况下Population与 Murder的关系
推荐一个博主:https://blog.csdn.net/weixin_51077152?type=blog
笔记做得很nice
相关性检验
cor.test()
上面的cor()函数虽然可以分析得到相关程度的值,但是否可靠还需要进一步检验,相关性检验用的是
cor.test(x,y,alternative = c("two.sided","less","greater"),method = c(“pearson”, “kendall”, “spearman”))
alternative,用来指定进行双侧检验还是单侧检验(“less”,负相关;“greater”,正相关)
corr.test()
还可以加载psych包中的
corr.test(x,method = c(“pearson”, “kendall”, “spearman”))
x可以表示一组数据,例如x=state.x77
corr.test()函数每次只能检测一组变量,检测起来比较麻烦
pcor.test()
另外进行偏相关的检验可以使用
pcor.test(x,q,n)
x,pcor()函数计算的偏相关系数
q,需要控制的变量数
n,样本数
t.test()
除此之外,对于两个组的检验,还可以使用t.test()函数进行t检验,这种检验一般用于样本容量较小,一般小于30的检验
t.test(y~x,data)
y,数值型变量
x,二分型变量