admin管理员组文章数量:1567551
2024年2月8日发(作者:)
第1章 SPSS简介
SPSS简介。SPSS是Statisticl Package for Social Science的英文缩写,即:社会科学统计分析软件包,它是当今世界上公认和流行的综合统计分析软件包。SPSS的应用面广阔,它在经济学、生物学、心理学、医疗卫生、体育、农业、林业、商业、金融等各领域均有广泛的应用。SPSS提供了一种很友好的用户界面,需什么统计功能,直接单击菜单即可。通过简单的菜单式操作,就可以方便地规范和融合搜集到的原始数据,并能实施从简单的描述性统计分析到复杂的时序分析等多种方法,对数据进行建模,返回有意义的分析结果,比如客户特征的分类、发展趋势和预测等。把这些结果对应于实际,可以帮助使用者在发掘潜在客户、制定长远规划等工作上作出更加准确的判断。
SPSS的基本统计分析功能有:频数分析、描述统计量分析、相关分析、回归分析、因子分析、聚类分析、判别分析、各种统计图形等等。
数据文件的操作与建立
一、SPSS数据文件的特点
SPSS数据文件是一种有结构的数据文件,它包括文件结构和数据两部分。
SPSS数据文件中的一列数据称为一个变量,每个变量都有名称,SPSS数据文件的结构是对每个变量及相关属性的描述。
SPSS数据文件的建立步骤:
第一步:定义SPSS数据文件的结构;
第二步:输入数据。
二、数据文件的结构
SPSS数据文件的结构是对每列变量及其相关属性的描述,它包括:变量名、变量类型、变量宽度、变量名标签、变量值标签、变量列格式、变量缺失值、变量度量方法等信息。
(一)如何定义一个变量
单击数据编辑窗口下面的Variable View选项,数据窗口便处于定义变量状态,如图1-1所示:
1
图1-1 Variable View界面
1、变量名(Name)
变量名是变量存取的唯一标志。在定义SPSS数据文件结构时应首先给出每列变量的变量名。SPSS默认的变量名以VAR三个字母开头,后面跟补足5位的数字。如VAR00001、VAR00015等。
变量名的取名规则是:
(1)从SPSS12.0版本开始,变量名最多可写64个字符长度;
(2)首字符不能是数字,必须是24个英文字母或以下符号之一:@、#或$,其后可以是除了“?”、“!”、“*”之外的字母、数字、小数点或其他任意非标点符号的字符。下划线、圆点不能为变量名的最后一个字符。
★以“#”为首写的变量名特指草稿型变量。此种类型的变量只能在命令窗口使用,在其他地方不可用。
★以“$” 为首写的变量名特指SPSS的系统变量。系统变量不可修改,而且在程序中不可用,用户定义的变量不能以“$” 为首写。
(3)变量名不能与SPSS内部特有的具有特定含义的保留字符相同,如ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH,等;
(4)系统不区分变量名中的大小写字母,允许汉字作为变量名,汉字总数不能超过4个;
2
(5)变量名中不能包含空格。
2、变量的类型(Type)和宽度(Width)
SPSS中有三种基本的变量类型,即:数值型、字符型和日期型。每种变量类型的数据在数据编辑窗口中都有其默认的宽度和样式。
(1) 数值型
数值型是SPSS常用的变量类型。数值型的数据由0-9的阿拉伯数字和其他特殊符号,如美元符号、逗号、圆点组成的。如工资、年龄、成绩等变量都可定义为数值型数据。数值型有以下六种不同的表示方法:
A、标准数值型(Numeric)
标准数值型是系统默认的数据类型。标准数值型默认的最大显示宽度是8位(含小数点及负号),小数是2位。
例如:12345678、-1234567、12345.67、-1234.56
B、逗号数值型(Comma)
逗号数值型其整数部分从个位开始每隔3位以一个逗号分隔,用圆点作小数点。它的默认最大显示宽度是8位(含逗号所占的位数),小数是2位。
C、圆点数值型(Dot)
圆点数值型数据其整数部分从个位开始每3位以一个圆点分隔,用逗号作小数点。如:1.234,56
D、科学记数法型(Scientific Notation)
科学记数法也是数值型数据表示方式的一种。如:270用科学记数法表示为2.7E+02,其中的E表示以10为底,+02表示10的2次方;0.00036用科学记数法记为3.6E-04, E表示以10为底,-04表示负的4次方。
科学记数法默认的显示总宽度为8。
E、美元数值型(Dollar)
美元数值型主要用来表示货币数据,在数据前附加美元符号$。默认宽度是8位,小数是2位。
F、用户自定义型(Custom Currency)
用户自定义型是用户利用菜单的Options功能来定义的。
(2)字符型(String)
3
由一个字符串组成。如职工号码、姓名、地点等变量都可定义为字符型数据。字符型数据的默认显示宽度为8个字符位,它不能进行算术运算,并区分大小写字母。字符串中的大写字母与小写字母,是截然不同的两个字符,这一点在使用时要特别注意。
(3)日期型(Data)
日期型数据用来表示日期或者时间。如生日、成立日期等可定义为日期型数据。日期型数据的显示格式很多,例如:dd-mmm-yy(例子15-OCT-99)、dd-mmm-yyyy(例子15-OCT-1999)、mm/dd/yy(例子10/15/90)、hh:mm:ss.s(例子01:02:34.75)等等。
下面给出关于日期型变量格式的几点说明:
★“dd”是用两位数来表示日期数;
★“ddd”是用三位数来表示从元月一日算起的日数;
★“mm”是用数字表示的月份数;
★“mmm”是用英文月份单词的前3个字母表示的月份;
★“yy” 是用两位数来表示的年份;
★“yyyy” 是用四位数来表示的年份;
★“hh”表示小时;“mm”表示分钟;“ss”表示秒;
★“m”用于年与日(字母y与d)之间时表示月份;用于时与秒(字母h与s)之间时表示分钟。
指定了日期型变量的格式后,输入时不一定按指定的格式输入,可以用“/”或“_”作为具体日期的分隔符,回车后系统回自动转换成指定的格式。
SPSS以菜单的方式将所有的日期显示格式列出来供用户选择。
3、定义变量名标签(Variable Label)
变量标签是对变量名的进一步说明,当变量名较短时,自身字符不足以表明其具体含义,而当变量比较多时更需要对变量名的含义加以详细解释。在定义变量窗口中Label下的单元格中输入标签。如name栏的“g”代表性别,则Label栏输入“性别”。在统计分析的输出结果中,可以在与变量名相对应的位置显示该变量的标签,或者直接以变量标签替代变量名显示,这有助于理解和分析输出结果。如图1-2所示:
4
变量名标签
图1-2
变量名标签定义对话框
4、定义变量值标签(Value Label)
变量值标签是对变量取值所作的进一步说明。分类变量经常需要定义其取值的标签。例如对于性别数据,假定用1代表男,用0表示女。变量值标签是一个可选择的属性,可以定义,也可以不定义,但像性别之类的变量最好给出变量值标签。如图1-3所示:
变量值标签
图1-3
变量值标签定义对话框
5、变量列格式(Column Formar)
数据列格式包括变量的列宽度(Columns )和数据的对齐方式(Align)。
(1)宽度(Columns )显示数据的长度。例如:可以单击Columns下的单元格,选择列宽数值。在定义变量列格式的宽度时,要综合考虑变量类型所定义的长度和变量名所占的宽度,选择较大的一个作为该变量的列格式宽度,这样才能保证变量名和变量值都可以正常显示。
(2)对齐方式(Text Alignment):分左对齐、右对齐、中间对齐。例如:
5
可以单击Align下的单元格,选择对齐方式。
6、变量缺失值(Missing Values)
已经输入的失真数据,没有测到或没有记录的数据,以特殊的数字或符号输入到数据文件中,统称为“缺失值”,分析时不能使用,要单独处理。各分析过程对缺失值的处理都有默认的方法,也可以由用户指定如何处理这些缺失值。
7、变量的测度方式(Measure)
定比测度(Scale),即按比例测度的变量。如身高、体重。
定序测度(Ordinal),如表示职称、职位、对某种事物的赞同程度的变量。
定类测度(Nominal)如表示民族、宗教信仰、党派等的变量。
可以单击Measure下的单元格,选择测度方式。
四、数据的录入与保存
1、数据的录入
定义好变量后,在图1-4所示的数据编辑窗口(Data View窗口),可以直接录入和编辑数据。每一列代表一个变量,每一行是数据文件的一个记录。如图1-4所示:
图1-4 数据录入窗口
2、数据文件的保存
SPSS数据文件保存的操作步骤是:
(1)菜单选项:File→Save或者File→Save as
(2)给出存放数据文件的目录路径和数据文件的用户名,并根据实际需要,选择数据文件的格式和相应的文件扩展名。扩展名默认为.sav。
6
操作练习:已知2007年我国各地区农村居民家庭人均纯收入如下表所示:
2007年我国各地区农村居民家庭人均纯收入
编号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
地区
北 京
天 津
河 北
山 西
内蒙古
辽 宁
吉 林
黑龙江
上 海
江 苏
浙 江
安 徽
福 建
江 西
山 东
河 南
人均纯收入(元)
9439.63
7010.06
4293.43
3665.66
3953.10
4773.43
4191.34
4132.29
10144.62
6561.01
8265.15
3556.27
5467.08
4044.70
4985.34
3851.60
编号
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
地区
湖 北
湖 南
广 东
广 西
海 南
重 庆
四 川
贵 州
云 南
西 藏
陕 西
甘 肃
青 海
宁 夏
新 疆
人均纯收入(元)
3997.48
3904.20
5624.04
3224.05
3791.37
3509.29
3546.69
2373.99
2634.09
2788.20
2644.69
2328.92
2683.78
3180.84
3182.97
资料来源:《中国统计年鉴2008》。
要求:在SPSS“Variable View”窗口给出变量名;在“Data View”窗口录入数据。
操作练习答案:
在“Variable View”窗口给出变量名:
7
在“Data View”窗口录入数据:
8
版权声明:本文标题:第1章 SPSS简介 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.elefans.com/dianzi/1707338230a192648.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论