spss实战案例----分析多个变量与因变量之间是否存在关系,方差分析

article/2025/8/14 9:24:51

本案例是IBM SPSS数据分析与挖掘实战案例精粹----第七章的学习记录

案例背景或目标:激素水平是否在对照组和实验组之间存在差异

分析方法:Bootstrap抽样,秩和检验,秩变换方法,cox回归

字段包括:性别,年龄,萎缩程度,胃粘膜细胞肠化生程度

基本思路:控制变量法,首先排除性别,年龄,萎缩程度,胃粘膜细胞肠化生程度的影响;

探索性数据分析:观察样本量,样本的分布,是否存在偏态分不等;

样本分布:分析-表

  性别萎缩肠化年龄分组
  轻度中度重度轻度中度重度青年组中年组老年组
  CountCountCountCountCountCountCountCountCountCountCountCount
组别试验组2512141671012132151210
对照组20110000000101110

查看激素水平分布:图形--图表构建程序

 

 激素水平呈明显的正偏态分布,必须考虑假设检验方法对数据的分布要求;

采用Bootstrap抽样进行分析:常用经典统计学的分析方法,无一例外的需要对变量的分布进行假定,然后才能进行相应的计算;ootstrap抽样的基本思想是在全部样本未知的情况下,借助部分样本的有放回多次抽样,构建某个估计的置信区间,抽象地说,通过样本得到的估计并没有榨干样本中的信息,bootstrap利用重采样,把剩余价值发挥在构建置信区间上。

bootstrap抽样方法:分析--比较均值--均值--因变量列表(激素水平),自变量列表(组别,性别,年龄),选项--中位数--加入“单元格统计量”,bootstrap子对话框中“执行bootstrap”

 可以观察各个统计量95%区间差异,对某因素的影响进行分析;中位数并不重叠,可能存在统计学差异(初步分析);可以采用采用秩和检验进行更精确的分析:

对因变量变量变换后的建模分析:

常见的变量变换方法:1,对数转换;2,平方根转换;3,平方根正弦转换sin(开方);4:平方转化;5,倒数转换;6,Box-Cox变换;

对于正偏态分布,一般常用的是对数变换:分析----描述统计----P-P图(数据符合指定分布时,P-P图中各点近似呈一条直线。)

将字段进行转换后,使用:

1)分析----一般线性模型----单变量

2)将Injisu选入“因变量”列表框

3)将组别,性别选入“固定因子”列表框,年龄选入“协变量”列表框

4)“模型”子对话框,将组别,性别,年龄的主效应选入“模型”列表框

5)“选项”子对话框,选择“残差图”和“缺乏拟合优度检验”

6)确定。

上图,总模型p值为0.003,说明整个模型对injisu的预测是有统计学意义的(变量之间相关的),分项来看,只有组别具有统计学意义;

秩变换分析:

当变量转换无法解决问题时,可以使用秩变换:转换----个案排序-----将激素水平放入“变量”列表框;

将字段进行转换后,使用:

1)分析----一般线性模型----单变量

2)将Rjisu选入“因变量”列表框

3)将组别,性别选入“固定因子”列表框,年龄选入“协变量”列表框

4)“模型”子对话框,将组别,性别,年龄的主效应选入“模型”列表框

5)“选项”子对话框,选择“残差图”和“缺乏拟合优度检验”

6)确定。

利用Cox模型进行分析:秩变换分析会损失一些信息,除了非参数方法外,还可以利用生存分析中的COX回归模型进行分析

总结:性别,年龄对激素水平未发现有影响,试验组和对照组之间的激素水平存在明显差异;对于同一个统计问题,可以使用多种模型进行解决,没有正确的模型,只有更加适合的模型;当结论不一样时,应根据模型的特点以及真实情况,判断那种情况更接近真实;也可以使用投票策略进行确定(类似与随机森林,选择多数模型结果)


http://chatgpt.dhexx.cn/article/Iw3hsbtH.shtml

相关文章

Python学习16 ----Seaborn多变量分析绘图

Seaborn多变量分析绘图 代码详见https://github.com/RenDong3/Python_Note 1 读取数据 2 分析绘图 parameters: x,y,hue 数据集变量 变量名data 数据集 数据集名row,col 更多分类变量进行平铺显示 变量名col_warp 每行的最高平铺数 整数estimator 在每个分类中进行矢量到标…

用SPSS进行多变量数据分析

用SPSS进行多变量数据分析 1.将所给的数据输入SPSS 22.0中文版。分别设置变量为温度,体重1、2、3、4;体重,温度5、10、15、20、30。 2.用SPSS进行作图(过程略)。 3.对数据进行多因素变量分析,具体操作如…

解读SPSS多元方差分析中的多因素多变量的相互影响

多元方差分析研究的是多个自变量与多个因变量的相互关系,也被称为多变量分析。在《怎么使用SPSS的多元方差分析法》一文中,我们已经详细学习了IBM SPSS Statistics多元方差分析的设置方法。 本文将会重点介绍如何解读多元方差分析的检验结果。由于多元方…

高维数据中特征筛选方法的思考总结——多变量分析筛选法

前言:之前的文章(高维数据中特征筛选方法的思考总结——单变量分析筛选法)中,对单变量分析筛选变量进行了初步考量,本文将进一步总结多变量分析筛选法。由于本文多处摘录网上的博客,只是进行了归纳整理&…

R语言实现单变量分析教程

单变量分析是理解单个变量的数值分布情况,与之相对的有双变量分析和多变量分析。 加载示例数据 因为csv文件中年收入字段有千分位分隔符,所以先定义转换函数。 setClass("num.with.commas") setAs("character", "num.with.co…

多变量分析绘图及分类属性绘图【知识整理】

多变量分析绘图及分类属性绘图 综述代码模块多指标离散图绘制盒图violin图条形图点图多层面板分类图factorplot()详细说明 小结 综述 学生党整理一些关于数据分析的知识:整理了多变量分析绘图及分类属性绘图的相关代码。主要包括了多指标离散图的绘制、盒图的绘制、…

python多变量相关性分析_多变量相关性分析(一个因变量与多个自变量)

目录:前言 偏相关或复相关 意义与用途 分析方法: 1、 样本相关系数矩阵、相关系数检验 2、 复相关分析 3、 决定系数 (RMSE的介绍) 小结 一、前言: 继上一篇文章,继续探讨相关性分析,这次不再是两个变量,而是3个或者以上的变量之间的相关关系分析。 没读过上…

一文了解11个常见的多变量分析方法!

在社会科学研究中,主要的多变量分析方法包括多变量方差分析(Multivariate analysis of variance,MANOVA)、主成分分析(Principal component analysis)、因子分析(Factor analysis)、…

多变量分析”——数据挖掘、数据分析

I。多重对应分析 多重对应分析在超过两个以上定类变量时有时候非常有效,当然首先我们要理解并思考,如果只有三个或有限的几个变量完全可以通过数据变换和交互表变量重组可以转换成两个定类变量,这时候就可以用简单对应分析了。 对应分析对数据…

点赞、收藏必读文章--数据分析的多变量分析

数据探索性分析(EDA)——多(双)变量分析 0 引言 上一篇文章震惊!Python单变量分析竟然如此简单? 介绍了数据分析中的单变量分析,但是我们在实际场景中,遇到的数据大多数是具有多特征、多变量的,因此除了对单个变量进…

“多变量分析”——数据挖掘、数据分析

I。多重对应分析 多重对应分析在超过两个以上定类变量时有时候非常有效,当然首先我们要理解并思考,如果只有三个或有限的几个变量完全可以通过数据变换和交互表变量重组可以转换成两个定类变量,这时候就可以用简单对应分析了。 对应分析对数据…

Open source Python toolbox for seismology

Open source Python toolbox for seismology ObsPy: A Python Toolbox for Seismology https://www.iris.edu/hq/webinar/2015/05/obspy_a_python_toolbox_for_seismology https://github.com/obspy/obspy http://www.obspy.org → https://github.com/obspy/obspy/wiki 2.用p…

Xmy的Python----Numpy库

目录 例题10-1:创建数组并查看数组属性 构造复杂数组 生成随机数 例题10-2:绘制:随机生成10000数据,服从均值为0,方差为1的正态分布的直方图(间隔个数:50) 通过索引访问数组 数组的…

python3.8安装pysal库

python3.8 安装 pysal 库 我最后是在虚拟环境中测试成功的,在原来的环境中测试还是有问题,但是装这个库只是为了一个assignment,踩完坑来总结一下,先用上再说。 1. 创建虚拟环境 正常环境无论是conda install 还是 conda-forge …

YYlabelCopy

YYlabelCopy 前言 最近公司刷题项目重构,之前刷题是采用富文本渲染,性能极差,业界大神ibireme的YYKit想必大家都知道,YYText的好用之处我就不再赘述.一开始我们是把UIlabel换成YYTextView,为什么不直接换成YYlabel,YYlabel支持异步绘制,因为我们是做公考项目的,试题都要支持复…

Kong Customize Python Plugin

Kong Customize Python Plugin 前情提要:由于公司业务需求,需要针对 Kong 自定义插件,而 Kong 的插件主要是 Lua 语言,公司的技术栈是 Python,所以升级了 Kong 版本到 3.1。Kong3.1支持使用 Python 语言的插件&#xf…

ubuntu中pip install cython_bbox报错

pip install cython_bbox报错 问题记录 pip install cython_bbox报错如下 Collecting cython_bboxUsing cached cython_bbox-0.1.3.tar.gz (41 kB)Preparing metadata (setup.py) ... errorerror: subprocess-exited-with-error python setup.py egg_info did not run succe…

Cython-bbox pip 安装报错

安装步骤 下载Cython_bbox源码,点击Download files下载。解压文件。打开setup.py,找到第31行,把其中extra_compile_args[’-Wno-cpp’]的替换为extra_compile_args{‘gcc’: [‘/Qstdc99’]}。保存改动,返回cython_bbox-0.1.3文件…

pysot-toolkit测试及对比

文章目录 前言1、环境搭建2、文件配置3、测试及对比3.1 单跟踪器测试3.2 多跟踪器对比 前言 pysot-toolkit是一款评估单目标跟踪性能的工具,可以计算OPE(One Pass Evaluation)下的Success和Precision、以及VOT(Visual Object Tracking)的性能指标Accuracy、Robustne…

Python加解密库——pycrypto(pycryptodome)

文章目录 简介安装方法一:Visual Studio方法二:pycryptodome(推荐) 初试公钥加解密对称加密非对称加密 数字签名哈希函数安全通信加密IO封装遇到的坑参考文献 简介 pycrypto 实现了哈希函数(如 SHA256)和加…