admin管理员组

文章数量:1567551

2024年2月8日发(作者:)

第1章 SPSS简介

SPSS简介。SPSS是Statisticl Package for Social Science的英文缩写,即:社会科学统计分析软件包,它是当今世界上公认和流行的综合统计分析软件包。SPSS的应用面广阔,它在经济学、生物学、心理学、医疗卫生、体育、农业、林业、商业、金融等各领域均有广泛的应用。SPSS提供了一种很友好的用户界面,需什么统计功能,直接单击菜单即可。通过简单的菜单式操作,就可以方便地规范和融合搜集到的原始数据,并能实施从简单的描述性统计分析到复杂的时序分析等多种方法,对数据进行建模,返回有意义的分析结果,比如客户特征的分类、发展趋势和预测等。把这些结果对应于实际,可以帮助使用者在发掘潜在客户、制定长远规划等工作上作出更加准确的判断。

SPSS的基本统计分析功能有:频数分析、描述统计量分析、相关分析、回归分析、因子分析、聚类分析、判别分析、各种统计图形等等。

数据文件的操作与建立

一、SPSS数据文件的特点

SPSS数据文件是一种有结构的数据文件,它包括文件结构和数据两部分。

SPSS数据文件中的一列数据称为一个变量,每个变量都有名称,SPSS数据文件的结构是对每个变量及相关属性的描述。

SPSS数据文件的建立步骤:

第一步:定义SPSS数据文件的结构;

第二步:输入数据。

二、数据文件的结构

SPSS数据文件的结构是对每列变量及其相关属性的描述,它包括:变量名、变量类型、变量宽度、变量名标签、变量值标签、变量列格式、变量缺失值、变量度量方法等信息。

(一)如何定义一个变量

单击数据编辑窗口下面的Variable View选项,数据窗口便处于定义变量状态,如图1-1所示:

1

图1-1 Variable View界面

1、变量名(Name)

变量名是变量存取的唯一标志。在定义SPSS数据文件结构时应首先给出每列变量的变量名。SPSS默认的变量名以VAR三个字母开头,后面跟补足5位的数字。如VAR00001、VAR00015等。

变量名的取名规则是:

(1)从SPSS12.0版本开始,变量名最多可写64个字符长度;

(2)首字符不能是数字,必须是24个英文字母或以下符号之一:@、#或$,其后可以是除了“?”、“!”、“*”之外的字母、数字、小数点或其他任意非标点符号的字符。下划线、圆点不能为变量名的最后一个字符。

★以“#”为首写的变量名特指草稿型变量。此种类型的变量只能在命令窗口使用,在其他地方不可用。

★以“$” 为首写的变量名特指SPSS的系统变量。系统变量不可修改,而且在程序中不可用,用户定义的变量不能以“$” 为首写。

(3)变量名不能与SPSS内部特有的具有特定含义的保留字符相同,如ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH,等;

(4)系统不区分变量名中的大小写字母,允许汉字作为变量名,汉字总数不能超过4个;

2

(5)变量名中不能包含空格。

2、变量的类型(Type)和宽度(Width)

SPSS中有三种基本的变量类型,即:数值型、字符型和日期型。每种变量类型的数据在数据编辑窗口中都有其默认的宽度和样式。

(1) 数值型

数值型是SPSS常用的变量类型。数值型的数据由0-9的阿拉伯数字和其他特殊符号,如美元符号、逗号、圆点组成的。如工资、年龄、成绩等变量都可定义为数值型数据。数值型有以下六种不同的表示方法:

A、标准数值型(Numeric)

标准数值型是系统默认的数据类型。标准数值型默认的最大显示宽度是8位(含小数点及负号),小数是2位。

例如:12345678、-1234567、12345.67、-1234.56

B、逗号数值型(Comma)

逗号数值型其整数部分从个位开始每隔3位以一个逗号分隔,用圆点作小数点。它的默认最大显示宽度是8位(含逗号所占的位数),小数是2位。

C、圆点数值型(Dot)

圆点数值型数据其整数部分从个位开始每3位以一个圆点分隔,用逗号作小数点。如:1.234,56

D、科学记数法型(Scientific Notation)

科学记数法也是数值型数据表示方式的一种。如:270用科学记数法表示为2.7E+02,其中的E表示以10为底,+02表示10的2次方;0.00036用科学记数法记为3.6E-04, E表示以10为底,-04表示负的4次方。

科学记数法默认的显示总宽度为8。

E、美元数值型(Dollar)

美元数值型主要用来表示货币数据,在数据前附加美元符号$。默认宽度是8位,小数是2位。

F、用户自定义型(Custom Currency)

用户自定义型是用户利用菜单的Options功能来定义的。

(2)字符型(String)

3

由一个字符串组成。如职工号码、姓名、地点等变量都可定义为字符型数据。字符型数据的默认显示宽度为8个字符位,它不能进行算术运算,并区分大小写字母。字符串中的大写字母与小写字母,是截然不同的两个字符,这一点在使用时要特别注意。

(3)日期型(Data)

日期型数据用来表示日期或者时间。如生日、成立日期等可定义为日期型数据。日期型数据的显示格式很多,例如:dd-mmm-yy(例子15-OCT-99)、dd-mmm-yyyy(例子15-OCT-1999)、mm/dd/yy(例子10/15/90)、hh:mm:ss.s(例子01:02:34.75)等等。

下面给出关于日期型变量格式的几点说明:

★“dd”是用两位数来表示日期数;

★“ddd”是用三位数来表示从元月一日算起的日数;

★“mm”是用数字表示的月份数;

★“mmm”是用英文月份单词的前3个字母表示的月份;

★“yy” 是用两位数来表示的年份;

★“yyyy” 是用四位数来表示的年份;

★“hh”表示小时;“mm”表示分钟;“ss”表示秒;

★“m”用于年与日(字母y与d)之间时表示月份;用于时与秒(字母h与s)之间时表示分钟。

指定了日期型变量的格式后,输入时不一定按指定的格式输入,可以用“/”或“_”作为具体日期的分隔符,回车后系统回自动转换成指定的格式。

SPSS以菜单的方式将所有的日期显示格式列出来供用户选择。

3、定义变量名标签(Variable Label)

变量标签是对变量名的进一步说明,当变量名较短时,自身字符不足以表明其具体含义,而当变量比较多时更需要对变量名的含义加以详细解释。在定义变量窗口中Label下的单元格中输入标签。如name栏的“g”代表性别,则Label栏输入“性别”。在统计分析的输出结果中,可以在与变量名相对应的位置显示该变量的标签,或者直接以变量标签替代变量名显示,这有助于理解和分析输出结果。如图1-2所示:

4

变量名标签

图1-2

变量名标签定义对话框

4、定义变量值标签(Value Label)

变量值标签是对变量取值所作的进一步说明。分类变量经常需要定义其取值的标签。例如对于性别数据,假定用1代表男,用0表示女。变量值标签是一个可选择的属性,可以定义,也可以不定义,但像性别之类的变量最好给出变量值标签。如图1-3所示:

变量值标签

图1-3

变量值标签定义对话框

5、变量列格式(Column Formar)

数据列格式包括变量的列宽度(Columns )和数据的对齐方式(Align)。

(1)宽度(Columns )显示数据的长度。例如:可以单击Columns下的单元格,选择列宽数值。在定义变量列格式的宽度时,要综合考虑变量类型所定义的长度和变量名所占的宽度,选择较大的一个作为该变量的列格式宽度,这样才能保证变量名和变量值都可以正常显示。

(2)对齐方式(Text Alignment):分左对齐、右对齐、中间对齐。例如:

5

可以单击Align下的单元格,选择对齐方式。

6、变量缺失值(Missing Values)

已经输入的失真数据,没有测到或没有记录的数据,以特殊的数字或符号输入到数据文件中,统称为“缺失值”,分析时不能使用,要单独处理。各分析过程对缺失值的处理都有默认的方法,也可以由用户指定如何处理这些缺失值。

7、变量的测度方式(Measure)

定比测度(Scale),即按比例测度的变量。如身高、体重。

定序测度(Ordinal),如表示职称、职位、对某种事物的赞同程度的变量。

定类测度(Nominal)如表示民族、宗教信仰、党派等的变量。

可以单击Measure下的单元格,选择测度方式。

四、数据的录入与保存

1、数据的录入

定义好变量后,在图1-4所示的数据编辑窗口(Data View窗口),可以直接录入和编辑数据。每一列代表一个变量,每一行是数据文件的一个记录。如图1-4所示:

图1-4 数据录入窗口

2、数据文件的保存

SPSS数据文件保存的操作步骤是:

(1)菜单选项:File→Save或者File→Save as

(2)给出存放数据文件的目录路径和数据文件的用户名,并根据实际需要,选择数据文件的格式和相应的文件扩展名。扩展名默认为.sav。

6

操作练习:已知2007年我国各地区农村居民家庭人均纯收入如下表所示:

2007年我国各地区农村居民家庭人均纯收入

编号

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

地区

北 京

天 津

河 北

山 西

内蒙古

辽 宁

吉 林

黑龙江

上 海

江 苏

浙 江

安 徽

福 建

江 西

山 东

河 南

人均纯收入(元)

9439.63

7010.06

4293.43

3665.66

3953.10

4773.43

4191.34

4132.29

10144.62

6561.01

8265.15

3556.27

5467.08

4044.70

4985.34

3851.60

编号

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

地区

湖 北

湖 南

广 东

广 西

海 南

重 庆

四 川

贵 州

云 南

西 藏

陕 西

甘 肃

青 海

宁 夏

新 疆

人均纯收入(元)

3997.48

3904.20

5624.04

3224.05

3791.37

3509.29

3546.69

2373.99

2634.09

2788.20

2644.69

2328.92

2683.78

3180.84

3182.97

资料来源:《中国统计年鉴2008》。

要求:在SPSS“Variable View”窗口给出变量名;在“Data View”窗口录入数据。

操作练习答案:

在“Variable View”窗口给出变量名:

7

在“Data View”窗口录入数据:

8

本文标签: 变量数据变量名