SPSS学习(1)之数据录入与数据获取

article/2025/7/3 16:23:31

SPSS系列文章是本人根据张文彤的《SPSS20.0统计分析基础教程第2版》学习SPSS中学习笔记,仅作参考和学习。

在SPSS中建立数据文件大致有两种情况:

  • 一种是非电子化的原始数据资料,需要直接将调查问卷中的数据录入SPSS软件,建立数据文件;
  • 另一种是已经被录入为其他数据格式的资料,需要将其内容直接读入SPSS中。
针对这两种情况,我们一起来研究下,如何将数据录入到SPSS中,以及如何将其他格式的数据读入SPSS中。

1.统计软件中数据的录入格式

统计软件中数据的录入格式和大家平时记录数据用的格式不太相同,SPSS所使用的数据格式也需要遵守相应的格式要求,其基本原则如下:

  • 不同个案(Case)的数据不能在同一条记录中出现,即同一个案的数据应当独占一行(一个个案占一行);
  • 每一个测量指标/影响因素只能占据一列的位置,即同一个指标的测量数值都应当录入到同一个变量中去(一个变量占一列)。

但有时分析方法会对数据有特别的要求,此时可能会违反“一个个案占一行,一个变量占一列”的原则,这种情况在配对数据中和重复测量数据中最多见。这是因为根据分析模型的要求,需要将同一个观察对象某个观察指标的不同次测量看成是不同的指标,因此被录入成了不同的变量,这是允许的。但对于统计的初学者而言,最好能够严格遵守以上规则,而且无论表现格式怎样,最终的数据集都应当能够包含原始数据的所有信息。

2.变量属性

任何一个变量显然都应当有变量名与之对应,但为了进一步满足统计分析的需求,除变量名外,在统计软件中还常常对每一个变量进一步定义许多附加的变量属性,如变量类型(Type)、变量宽度(Width)、小数位(Decimal)等。

如图,在SPSS的数据管理窗口的变量视图中,可以看出SPSS为每一个变量指定11种变量属性。


  • 变量的存储类型

SPSS中的变量有3种基本类型,分别是数值型、字符串和日期型。根据不同的显示方式,数值型又被分为了5种或者6种(因版本而异),所以SPSS中的变量类型共有8种(9种)。在变量视图中选择“类型”单元格时,可以定义数据类型。如下图所示:


如图所示:左侧为具体的存储类型,右侧则用于进一步定义变量宽度、小数位数等。

(1)数值型(Numeric):在以上3大类变量类型中,数值是SPSS是最常用的变量类型。数值型的数据是由0-9的阿拉伯数字和其他特殊符号,如美元符号、逗号或者圆点组成的。数值型数据根据内容和显示方式的不同,又可分为标准数值型(Numeric)、每3位用逗号分隔的逗号数值型(Comma)、每3位用圆点分隔的圆点数值型(Dot)、科学计数型(Scientific Notation)、显示时带美元符号的美元数值型(Dollar)、用户自定义型(Custom Currency)等6种不同的便是方法。

(2)字符型( String):字符型也是 SPSS 较常用的数据类型,字符型数据 的默认显示宽度为 8个字符位,它区分大小写字母,并且不能进行数学运算。 字符型数据在SPSS的数据处理过程 (如在计算生成新变量时 )中是用一对引号引起来的。 需要注意的是,在输入数据 时不应输入引 号,否则,双引号将会作为字符型数据的一部分。

(3)同期型( Date):这种类型的数据是用来表示日期或时间的。 H期型数据的显示格式有很多,SPSS在对话框右侧会以列表框的方式列出各种显示格式以供用户选择。 如果此处选择的 是mm/dd/yy或类似的两位数年份记录方式,则需要在系统选项的“数据”选项卡中确定具体的世纪范围,目前系统默认为1941-2040年区间。

事实上,SPSS中的日期型变盘存储的是该时间与1582年JO月14日零点相差的秒数,如 1582年10月15日存储的就是 60×60×24=86 400,将变量类型变换为数值型就可以看到。但 是这里只能存储正数,即1582年JO月14日及更早的时间在SPSS中是无效的。 日期型数据主 要在时间序列分析中比较有用,在较为简单的分析问题中完全可以用普通数值型数据 来代替。

  • 变量的测量尺度

如果只使用变量类型,很多时候并不能准确地说明变量的含义和属性。比如:变量S2“性别” :用l代表男,2代表女。 在这里1和2只是一个符号,没有任何数字意 义。 2并不比1大,1也并不比2小。

上述 S2变量的存储类型是数值型,但数值的具体含义不同,所携带的信息量不同,适用的统计方法也就不同。如果只以存储类型来说明这个变盘的属性,就不能反映上 述区别。 为此,就有必要给变量增加测量尺度 这一属性。

在统计学中,按照对事物描述的精确程度,将所采用的测量尺度从低到高分为4个层次:定类尺度、定序尺度、定距尺度和定比尺度。 在这 4种测量尺度之间,按照信息量的高 低,可将高层 次测量尺度的测量结果转换为低层次测量尺度的测量结果,但 这样会损失一部分信息,但不能将低层次的测量尺度转换为高层次测量尺度的结果, 这样可能会引人错误的信息。

在SPSS中使用度量标准( Measure)属性对变量的测量尺度进行定义,其中定类尺度变量用“名义( N)”来表示。 能使用的定类尺度的数据可以是数值型变量,也可以是字符型变量。使用定类变量对事物进行分类时,必须符合穷尽和互斥的原则。 穷尽的原则就是指“ 每个个体都必须能归为一个类别”,互斥的原则 是指“每个个体都只能归为一个类别” 。

定序尺度变量用 “序号(0)”来表示。 定序变量同定 类变量一样,其数据可以是数值型变量,也可以 是字符型变量。对于定序变量除了可以计算频率之外,还可以计算累计频率。 如足球喜欢程度这一变量的取值有:1 一非常喜欢,2一喜欢,3一无 所谓,4一不喜欢,5一非常不喜欢,这是一个定序尺度的变量,因而可以计算累计频数和累计频 率。如对于“足球喜欢程度”,不仅可以计算喜欢的人数和比例,还可以计算喜欢及非常喜欢的 累计人数和比例。

定距尺度( Interval M创surement)是对事物类别或次序之间间距的测度,定比尺度( Scale Measurement)是能够测算两个测度值之间比值的一种计量尺度,它的测量结果同定距变量一样也表现为数值,如职工月收入、企业销售额等。

SPSS中默认的变量测量尺度就是定比尺度。但由于定距和定比测量尺度在绝大多数统计分析中没有本质上的差别,在SPSS中就将其合并为一类,统称为“ 度量( S)

  • 变量名与变量值标签

变量名标签: 对变量名的含义进行进一步解释说明,该标签会在结果中输出以方便阅读,增强变量名的可视性和l统计分析结果的可读性。

值( Values)属性: 用于定义变量值标签(对变量;取值含义的解释说明信息,例如1 , 对于性别数据,假设用1表示男,用2表示女)


  • 缺失值

缺失(Missing)属性用于定义变量缺失值。SPSS中缺失值有用户自定义缺失值和系统缺失值两大类。 对于数值型变量的数据,系统缺失值用 一个国点“ . ”表示,而字符型变量默认就是空字符串。另外一类缺失值是用户自定义缺失值。

  • 角色

当打开其中一个对话框时,满足角色要求的变量将自 动显示在目标列表中。可用角色包括以下几个。

(1)输入:变量将用做输入(例如,预测变量、自变量)。

(2)目标 :变量将用做输出或目标 (例如,因变量)。
(3)两者:变量将同时用做输入和输出。
(4)无:变量没有 角色分配(将不纳人分析)。

(5)分区:变量用于将数据划分为单独的训练、检验和验证样本。

(6) 拆分:该项的存在主要是为了能够和Clementine(即现在的IBM SPSS Modeler)相互兼容。具有此角色的变量不会在SPSS中自动成为拆分文件变量。

在默认情况下,SPSS 将为所有 变量分配输入角色,需要指出的是,角色分配 只影响支持角色 分配 的对话框。

3.数据的直接录入

在SPSS中,新建一个数据文件非常容易。只要打开SPSS ,系统就巳经生成了一个空数据文件,用户只要按自己的需要在其中定义变盘、输入数据,然后保存即可。

  • 界面

  • 开放题和简单单选题的录入

(1)在SPSS中定义变量

变量 ID 是被访者的记录号,它的测量尺度应该是定类尺度。但需要指出的是,因为变 量 ID 只是方便检查和核对问卷,不参与后边的数据分析工作, 所以,在要求不严格的情况下,此处的变量类型可采用默认形式不进行修改。


(2)开放题的录入


(3)单选题的录入


(4)设置多选题变量集

在SPSS中选择“分析 ”→“多重响应” →“定义变量集”菜单项,打〕l:“定义多重响应集” 对话框,如下图所示:


4.外部数据的获取

对于 SPSS 格式的数据.只要选择 文件 → 打开 → 数据 菜单项,然后选择文件路径和 文件名打开即可。 如果数据不是 SPSS 格式的,也可以直接读入SPSS,用 SPSS 进行分析。 SPSS可以读入许多非 SPSS 默认类型的数据文件,方式主要有3 种,包括直接打开、利用文本向导读入文本数据,以及利用数据库 ODBC 接口读取数据。

  • SPSS可以直接打开的数据类型
    • S附S Statistics ( * . sav)             SPSS各版本的数据文件
    • SPSS/PC + ( * . sys)                   SPSS/PC +版本的数据文件

    • SPSS/PC + ( * . sys)                   SPSS/PC +版本的数据文件

    • 便携( * por) Excel        SPSS便携格式的数据文件

    • Excel ( *.xls,*. xlsx, *. xlsm)     Excel各版本的数据文件

    • Lotus( *. w * )                 Lotus各版本的数据文件

    • SYLK( *. slk)                以SYLK(符号链按)格式保存的数据文件

    • dBASE( *. dbf)                dBASE系列数据文件(从dBASEH~N)

    • SAS( *. sas7bdat,  *. sd7,…) SAS各版本的数据文件

    • Stata( *. dat)                       Stata 4~8版的数据文件

    • 文本格式(*.txt,*.dat)              纯文本格式的数据文件

  • 读取表格数据



http://chatgpt.dhexx.cn/article/gqKnya9Z.shtml

相关文章

【SPSS】第3讲学习笔记——数据导入和查看

1.除了自己手动定义变量、输入数据,还可以进行数据的导入 2.文件——打开——数据 3.打开数据窗口中,可以查看SPSS支持的多种数据类型 其中,常用的格式有:Excel的xls格式、txt文本格式、dBase的dbf格式等 4.选择Excel格式的数…

(一)Linux ALSA 音频系统:物理链路篇

物理链路篇 转自:https://me.csdn.net/zyuanyun Linux ALSA 音频系统:物理链路篇 Linux ALSA 音频系统:物理链路篇 原创 zyuanyun 最后发布于2017-03-01 22:16:29 阅读数 13482 收藏 发布于2017-03-01 22:16:29 分类专栏: Lin…

Android 中的混音器 AudioMixer 实现分析

Android framework 的音频处理模库 libaudioprocessing (位于 frameworks/av/media/libaudioprocessing) 提供了混音器组件 AudioMixer,它主要用在 audioflinger 里,用来将多路音频源数据混音,以方便送进音频设备播放出来。 音频混音操作本身…

JRTPLIB@Conference DIY视频会议系统

------------------------------------------------------------------------------------------------------------------------------ JRTPLIBConference DIY视频会议系统 一、开编 转自 http://wmnmtm.blog.163.com/blog/static/382457142011540719318/?suggestedreadin…

2003-2005上午试题分章别类(下)

第六章 多媒体基础知识 2005.11 ●___(57)___标准中定义了MP3音乐标准。供选择的答案:(57)A.JPEG     B.MPEG-1      C.MPEG-2     D.MPEG-3试题分析:MPEG-1:为数字存储媒体在1.5M比特/s的比特率对运动图象和关联的音频进行编码…

[转]AAC的各种规格

一、规格(profile)问题: wiki上说到,AAC共有9种规格,以适应不同的场合的需要: l MPEG-2 AAC LC 低复杂度规格(Low Complexity)--比较简单,没有增益控制,但提高了编码效率&am…

aac

Hi,又来写点儿小记录心得吧,这次是在准备AAC音频解码的规格中发现和总结出的一些问题,大概的情况在这里简要做一小记,为我们最后确立规格提供参考,当然我对AAC规格的了解还很稚嫩,有些表述不太确切的地方&a…

AAC的各种规格

Hi,又来写点儿小记录心得吧,这次是在准备AAC音频解码的规格中发现和总结出的一些问题,大概的情况在这里简要做一小记,为我们最后确立规格提供参考,当然我对AAC规格的了解还很稚嫩,有些表述不太确切的地方&a…

Android Audio混音实践篇

Android Audio混音实践篇 简介 本篇文章主要介绍Android Audio模块的MixerThread混音业务如何实现的?建议在阅读这篇文章之间先阅读混音理论基础篇,并且在分析源码之前:头脑里构想一个大致的混音过程,多路音频AudioTrack叠加在一…

6 FFmpeg从入门到精通-FFmpeg滤镜使用

1 FFmpeg从入门到精通-FFmpeg简介 2 FFmpeg从入门到精通-FFmpeg工具使用基础 3 FFmpeg从入门到精通-FFmpeg转封装 4 FFmpeg从入门到精通-FFmpeg转码 5 FFmpeg从入门到精通-FFmpeg流媒体 6 FFmpeg从入门到精通-FFmpeg滤镜使用 7 FFmpeg从入门到精通-FFmpeg中Linux设备操作 8 FFm…

量子计算--复习+量子信息--铺垫(学习笔记)

本次,我对前面所学的算符进行一定的拓展并对接下来的量子信息的学习做一些铺垫。 一.些概念的复习和拓展 在前面,我对量子计算的一些概念进行了简单的讲解,而且对一些概念描述的并不完整,所以此次我会完善一下厄米算符、幺正算符…

布尔定理及证明(完整版)

这篇文章的目的是以布尔代数公理证明定理。 对偶原理:0with1, with 互换以后,公理(定理)任然成立。 布尔代数的公理如下 单变量的布尔代数定理如下 单变量的布尔代数定理很容易用真值表证明。 多变量的布尔定理如下 交换律&…

欧拉函数、欧拉定理、费马小定理

生病了,耽搁了两天。明天开始继续和队友们一起奋战。。。 总结一下,自己以前学过的数论方面的知识。 今天小小的搜索一下,计算机数论真的是很庞大的一个领域。推荐一本书《计算数论》。准备买了、 这里先浅议下欧拉定理和欧拉函数。 很久…

Broekett定理):

设系统满足在邻域内连续可微,则该系统存在连续可微控制律使得被渐进稳定的必要条件是: 线性化之后的系统没有特征根为正实部的不可控模态; 存在的邻域,满足对任意,存在相应的定义在上的控制,使系统的解从…

海伯伦定理

谓词公式通过等价关系及推理规则化成相应的子句集 在谓词逻辑中,把原子谓词公式及其否定统称为文字。 定义3.5:任何文字的析取式称为子句。 例如: P(x)∨Q(x), P(x,f(x))∨Q(x,g(x)) 定义3.6:不包含任何文字的子句称为空子句…

费马小定理、欧拉定理与扩展欧拉定理(含证明)

这里就以自己做好的PPT图片的形式给出了:

量子笔记:单比特量子门、泡利矩阵

目录 0. 概要 1. 量子门基本性质 1.1 量子门与布洛赫球面的关系 1.2 量子门与幺正矩阵的关系 2. 泡利矩阵: 量子X,Y,Z,ID门 2.1 量子X门(量子非门) 2.2 量子Z门 2.3 量子Y门 2.4 量子ID门 6. 量子H门 7. 量子Z旋转门 7.1 量子S门 7.2 量子S…

图论之毕克定理证明

毕克定理是小学四年级奥赛内容,无意间从一本教材上看到,觉得定理蛮有意思,也和自己从事的工作有一些关联,就在网上找了一些证明资料,结合自己的思考,稍微挖掘了以下,聊以记录。 毕克定理是指一…

chapter 4 能带理论 energy band

继承自chapter 3 的自由电子模型: 4.1 单电子近似 One electron approximation 列出电子运动的薛定谔方程: E Ψ − ℏ 2 2 m ∇ 2 Ψ U Ψ E \Psi -\frac{\hbar^2}{2m} \nabla^2 \Psi U \Psi EΨ−2mℏ2​∇2ΨUΨ 根据电子在晶体中运动的实际情…