基础:导入外部数据"/>
SAS基础:导入外部数据
一、读入sas数据集
1.文件格式:待读入的文件为图中选中的文件(sales.sas7bdat)
2.sas代码:
libname orion 'F:\打散虾\sas\P1 DATA'; data work.subset1; set orion.sales; where Customer_Gender = 'F' and Customer_Age between 18 and 36 and Customer_Group contains 'Gold'; keep Customer_Name Customer_Age Customer_Gender; drop Customer_Group; format Salary dollar12. Hire_Date monyy7.; run; proc print data=work.subset1;
run;
注释:
1)libname:定义工作空间,orion是个名字,表示后面的物理地址
2)data:定义个工作薄,名字是work.subset1
3)set:说明data的数据从哪来,后面是来源
4)where:表示对原始数据的筛选,就是一些逻辑语句
5)keep:保留某几个变量
6)drop:删除某几个变量
7)format:表示某变量的数据格式,”dollar12.“表示数据格式(后面带点".")
8)run:运行
9)proc print:输出结果
二、读入excel数据集
1.文件格式:待读入的文件为图中选中的文件(sales.xls)
2.SAS代码:
data work.subset2; set orionxls.'Australia$'n; where Job_Title contains 'Rep'; keep First_Name Last_Name Salary Job_Title Hire_Date; label Job_Title='Sales Title'; format Salary comma10. Hire_Date weekdata.;
run; "label 表示输出的表格中,之前在data部分有label定义的都显示成定义后的内容"
proc print data=orionxls label;
run; "orionxls.'XXX$'n XXX表示列名"
proc print data=orionxls.'Australia$'n;
run; "取消分配逻辑库"
libname orionxls clear;
三、读入csv数据集
1.文件格式:sales.csv
2.SAS代码
data work.subset3; infile 'sales.csv' dlm=',';length First_Name Last_Name $ 12Gender $ 1; input Employee_ID First_Name $ Last_Name $ Gender $ Salary Job_Title $ Country $Birth_Date :date.Hire_Date :mmddyy.;
run; proc print data=work.subset3;
run;
其中:
1)length表示某裂变两的长度限制
2)”Birth_Date :date. “ 和 ”Hire_Date :mmddyy.“ 表示这两个变量是“data“格式以及”mmddyy“格式(月日年)
3)infile中 “ dlm=',' ” 和 “dsd” 等价
更多推荐
SAS基础:导入外部数据
发布评论