用SPSS做数据分析(1)

article/2025/8/26 22:30:09

写在前面:

爬虫今天停更一天,今天是周六,今天要把最近网课学习SPSS课程做个总结和回顾,明天继续更新爬虫的内容,今天这篇文章主要是SPSS中的数据管理,一些关于数据的简单操作,是属于SPSS中比较基础的内容,希望看完博客能动手亲自实践一下,会有奇效

文章目录

  • 写在前面:
  • SPSS数据管理:
    • 1.数据的录入:
      • SPSS中的数据文件格式:
    • 2.数据的保存:
    • 3.数据的整理:
      • 1.数据合并
        • 合并类型:
      • 2.数据个案的拆分:
      • 3.数据个案的排序
      • 4.数据汇总:
      • 5.数据的加权:
      • 6.数据重复查找:
      • 7.个案的选择:
      • 8.计算新变量:
      • 9.变量值的重新编码:
  • 写在后面:

SPSS数据管理:

1.数据的录入:

1.采用SPSS软件将原始数据进行录入
2.采用其他软件录入,保存为其他数据格式的资料,如xls,txt(有格式的).sys等

SPSS中的数据文件格式:

😐

数据文件文件拓展名对应窗口
数据文件.sav数据编辑窗口
语法文件.sps语法编辑窗口
输出文件.spv结果管理窗口
脚本文件.sbs脚本窗口

在SPSS中打开对应格式的文件,根据提示保存和修改自己需要的格式
重要的是变量视图中的变量的一些属性

2.数据的保存:

SPSS能够把数据保存为各种数据的格式
在这里插入图片描述

3.数据的整理:

在数据分析之前,往往需要对数据进行整理.

1.数据合并

  • 数据量很大时,经常需要将一份大的数据分成几个小部分,将这些若干个小的数据文件合并成一个大的数据文件,是进行各种统计分析的前提
    数据 ---->添加数据
    在这里插入图片描述

合并类型:

1.纵向合并:是几个数据集中的数据的纵向相加,组成一个新的数据集,新数据集中的数据就是原来几个数据集中的总和,实质就是两个数据文件的变量列,按照各个变量名的含义,一一对应进行首尾连接合并,两个数据文件的变量相同,合并的目的是增加分析个案.(添加个案)
合并条件:

  • 两个待合并的SPSS数据文件,其内含合并是有意义的
  • 为方便合并,在不同数据文件中,内容含义相同的列,最好起相同的名字,变量类型和变量长度也要尽量相同
    2.横向合并;按照记录的次序,或者某个关键变量的数值,将不同数据集中的不同变量合并为一个数据集,新数据集中的变量数是所有原数据集中不重名变量的总和,实质就是将两个数据文件的记录,按照记录对应,一一进行左右对接,合并的两个数据文件的变量不同,但具有相同个案例数.(添加变量)
    合并条件:
  • 如果不是按照记录号对应的规则进行合并,则两个数据文件必须至少有一个变量名相同的公共变量,这个变量是两个数据文件横向对应相等的依据,称为关键变量.如学号,贵宾卡号等(这个变量的值在同一个数据集中必须是唯一的,不然也不能作为关键变量)
  • 如果是使用关键变量进行合并的对应,则两个数据文件都必须事先按关键变量进行升序排列(必须做的,容易出错)
  • 为方便SPSS数据文件的合并,在不同数据文件中,数据含义不相同的列,变量名应该为不同的名称

2.数据个案的拆分:

  • 在进行统计分析时,只需要对具有某种特性的数据进行分析,俺么就涉及到分组分析,则可以通过查分数据集加以实现,它能够使数据分析过程暗战分组变量进行分组分析,得到各个组的结果.

数据---->拆分文件
在这里插入图片描述

3.数据个案的排序

数据编辑窗口个案的前后次序是随机的,其先后顺序是由录入时决定.在做统计分析时,对数据进行排序,能更好的了解数据.
数据 ---->排序个案
在这里插入图片描述
完成对职工号进行排序的结果:
在这里插入图片描述

4.数据汇总:

数据 ----->分类汇总—函数(选择合适的函数)

5.数据的加权:

为了在统计分析中让计算机知道每个分类或者每一个区间组段的频数,需要定义权重变量.
权重变量通常表示每个分类或者每个区间组段的频数,它是数值变量,且必须取正值.

数据 ---->加权个案—选择需要加权的变量

6.数据重复查找:

数据—>标识重复个案

7.个案的选择:

在数据分析过程中,根据不同的要求,需要从SPSS中对所有个案中筛选出特定的个案进行分析,这可以通过给数据表设置选择条件或者过滤条件,来满足这一要求.
选择类型:

  • 按条件选择(常用)
    给出一个SPSS条件表达式,选择符合该表达式的个案.
  • 按数据范围选择(常用)
    选择一定的数据范围内的全部个案,要求给出数据范围的上,下界的个案编号
  • 随机选择
    对数据编辑窗口中的所有个案进行随机筛选
  • 过滤变量选择
    指定一个已经存在的变量作为个案选择的标准

数据----->选择个案----写函数表达式

8.计算新变量:

  • 使用SPSS算术表达式及函数,对所有记录或者满足SPSS条件表达式的记录,计算出一个新结果,并将结果存入一个指定的变量中
  • 通过使用SPSS算术表达式,SPSS函数,SPSS条件表达式进行实现

转换-----计算变量----使用SPSS算术表达式,SPSS函数,SPSS条件表达式
在这里插入图片描述
在这里插入图片描述
求出了性别是男的三门功课的平均成绩
在这里插入图片描述

9.变量值的重新编码:

数据分析中,将连续变量转换为等级变量,或者将分类变量不同的变量等级进行合并是常见的工作.比如知道班级每位同学的平均成绩,但是需要将这些同学的成绩分为优秀,良好,中等,差4个等级,那么如何通过SPSS功能来完成这一任务呢?重新编码过程可以很好地完成这一类任务

什么是重新编码?
重新编码相同变量:对原始变量的取值进行修改,用新编码直接取代原变量的取值
重新编码不同变量:将新编码存入新的变量,根据原始变量的取值生成一个新变量来表示分组情况.

写在后面:

说一些题外话,这篇文章比较基础,写的也不是很好,但是我感觉最重要的是:基础的东西,其实你需要实际去操作,才能掌握的更深,同时我最近都会更新关于SPSS做数据分析的系列文章,如果你喜欢,或者你需要这方面的文章不妨一起学习,一起进步?


http://chatgpt.dhexx.cn/article/5FO87nu7.shtml

相关文章

利用SPSS做数据分析①(了解SPSS)

话不多说,上才艺,BGM,BGM,BGMBGM。。。哈哈哈哈 不闹了,接下来让我们一起认识一个非常好用的数据分析工具:SPSS 1、SPSS是什么? SPSS是广大统计爱好者和数据分析师最熟悉的名字,它…

如何用SPSS进行数据分析?

1.什么是SPSS SPSS是社会统计科学软件包的简称, 其官方全称为IBM SPSS Statistics。SPSS软件包最初由SPSS Inc.于1968年推出,于2009年被IBM收购,主要运用于各领域数据的管理和统计分析。作为世界社会科学数据分析的标准,SPSS操作…

数据分析5大软件大PK:Python、Excel、R、SAS、SPSS你最爱哪个?

转自 中国统计网 本文为转载分享,若侵权请联系后台删除 1 Excel Microsoft Excel是微软公司的办公软件Microsoft office的组件之一,是由Microsoft为Windows和Apple Macintosh操作系统的电脑而编写和运行的一款试算表软件。Excel 是微软办公套装软件的一个…

SPSS:数据分析

目录 1、数据采集 2、数据是否服从正态分布 3、T检验(T Test) 4、方差分析(ANOVA) 5、卡方检验(Chi-square Test) 6、灰色关联度分析(Grey Relation Analysis,GRA)…

[SPSS] SPSS统计分析软件简介

SPSS的英文缩写来源于以下两个 ① Statistical Package for Social Science(社会科学统计软件包) ② Statistical Product and Service Solutions(统计产品与服务解决方案) SPSS是一种专业的统计分析软件。为用户提供了直观的图形化菜单界面,用户的数据管理和统计…

SPSS软件介绍

SPSS软件界面描述 IBM SPSS是目前常用的一种统计分析软件,SPSS(Statistical Product and Service Solutions)是统计产品和服务解决方案软件,操作简单,无需写代码,只需确定要分析的数据及之间的因变、自变关…

数据分析软件及spss简单操作

数据分析软件介绍 SPSS统计软件 SPSS是英文Statistical package for the social science 的缩写,翻译成汉语是社会学统计程序包,20世纪60年代末由美国斯坦福大学的三位研究生研制,1975年在芝加哥组建SPSS总部。SPSS系统特点是操作比较方…

SPSS数据分析全套教程(1)——SPSS概览

SPSS数据分析全套教程(1)——SPSS概览 什么是SPSS? 社会科学统计软件包(Statistical Package for the Social Science,SPSS)是世界著名的统计分析软件之一。 经近40年的发展,在全球已拥有大量…

初识数据分析利器SPSS

今天这篇文章小白带大家了解一款做数据分析的利器—SPSS。 不知道大家有没有了解过SPSS,如果了解过甚至使用过的同学又对这款工具有多深的认识呢? SPSS是一款常用的数据分析工具,不管是在学校课程、学术论文还是数据分析工作中都是非常常见…

JLink的RTT使用

前言:什么是RTT? RTT( Real Time Terminal)是SEGGER公司新出的可以在嵌入式应用中与用户进行交互的实时终端。J-Link驱动4.90之后的版本都支持RTT。RTT既可以从MCU上输出信息、也可以向应用程序发送信息,由于其高速的特性&#…

使用RTT代替UART,把你的JLink变成串口调试助手~

摘要:不知道大家在单片机开发中是如何打印调试信息的,大多数应该是用串口调试打印吧,在大多数的情况下,一般在制板和写代码时都会预留串口1做为调试打印用。 但是在实际开发如果没有预留串口怎么办?其实我们的下载器是…

TCP RTT与TCP RTO关系详解

本文目录 1,TCP的RTT和TCP的RTO的定义1.1,什么是TCP的RTT1.2,什么是TCP的RTO 2,TCP的当前RTT和RTO的计算2.1,开始讲RTT计算算法前,我们先理解一下TCP里对RTT进行采样的流程2.2,最初始的TCP RTT和…

通过pylink给jlink-RTT添加时间戳

参考链接 目前还有一些bug,比如时间戳有时候会加在一行log的中间,有时候又会少一些时间戳,但是log目前没发现出现问题 在使用pylink时,需要用到Jlink的dll库,需要将D:\SEGGER\JLink_V766d文件夹下的JLink_x64.dll和JLi…

J-Link RTT 支持浮点数

RTT的使用 略 添加浮点数功能 注: 如下代码暂时不支持数据左补零,正浮点数前面显示等功能;不指定位宽时按实际位宽显示,不指定小数位数时按2位小数显示。 在SEGGER_RTT_printf.c文件的SEGGER_RTT_vprintf()函数中,添…

RTT Studio和Cubemx联合开发

1. RTT studio创建工程 创建工程 ## 创建完成以后的目录结构 2. 配置CubuMx 双击cubumx的图标打开CubeMx 配置时钟 生成代码 构建后的代码结构 编译代码满屏错误:不要慌 3. 新增脚本 新建scons脚本文件 SConscript 脚本内容如下,每次修改外…

STM32 RTT

1、安装包 如果安装过jlink,可以用evething来搜索“SEGGER_RTT”,选择“压缩文件”。 压缩文件中的RTT文件夹加入到项目当中 2、项目修改 3、使用 3.1 普通使用 SEGGER_RTT_printf(0, "Terminal 0 print:%d\r\n", i); 3.2 多端口…

[STM32]jlink RTT使用详解

1.什么是Jlink RTT。 全称为SEGGER’s Real Time Transfer(RTT),一种基于SEGGER公司的基于JLink调试器的交互式用户I/O的技术。故名思义,就是一种基于jlink的和用户进行交互的技术,可以直观的显示调试芯片的信息&#…

Redis-RTT

1. 什么是redis的RTT RTT是网络往返时间的简称 每一次执行redis都会向redis-server发送执行的命令(send),比如set a 1, redis-server接收到请求并执行后,会返回一个数据或结果(recv) , send时间和recv中间的时间就是RTT, 也就是说假如发送了三次redis命令,就会产生三个RTT redi…

TCP RTT 采集方法

TCP RTT 采集方法值得一提: 正常状态采集的 RTT 因加入了接收端 Delayed ACK,积累 ACK 等原因而偏大。Disorder,Recovery 状态采集的 RTT 相对准确,通过 Timestamps,SACK 采集。 平时抓包,Wireshark 如何…

keil工程,程序写多后,RTT不能打印

一、Options for Target,Code Generation 一般默认是Use default compiler version 5 ,选择V6.14,重新编译烧录程序,可以继续RTT打印。 修改为: 二、这样编译后,编译速度快很多,但是&#xff…