统计分析"/>
R语言整体数据描述性统计分析
R语言整体数据描述性统计分析
在这里主要对连续性变量进行整体统计性分析,包括最大最小值、中位数、均值、方差等统计量,但是这里不会分别进行分析计算,而是使用一个函数进行自动统计。
1、summary
该函数是R语言自带的函数,不需要安装任何包,summary()
函数提供了最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计。
分行分列统计数据还可以使用apply()
系列函数,详情请点击:apply系列函数
summary(mtcars)
该函数虽然简单易用,但是统计的内容有限,下面将介绍其他用于统计分析的函数。
2、 stat.desc()
pastecs
包中有一个名为 stat.desc()
的函数,它可以计算种类繁多的描述性统计量。使用
格式为:stat.desc(x, basic=TRUE, desc=TRUE, norm=FALSE, p=0.95)
- x 是一个数据框或时间序列
- basic=TRUE (默认值),则计算其中所有值、空值、缺失值的数量,以及最小值、最大值、值域,还有总和
- desc=TRUE (同样也是默认值),则计算中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、方差、标准差以及变异系数
- norm=TRUE (不是默认的),则返回正态分布统计量,包括偏度和峰度(以及它们
的统计显著程度)和Shapiro-Wilk正态检验结果。
install.packages("pastecs")
library(pastecs)
pastecs::stat.desc(mtcars,norm = TRUE)
该函数课统计的内容包括最小值、最大值、值域、总和、中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、方差、标准差、变异系数、正态分布统计量(包括偏度和峰度(以及它们 的统计显著程度)和Shapiro-Wilk正态检验结果)。
3、describe
psych包拥有一个名为
describe()` 的函数,它可以计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误。
install.packages("psych")
library(psych)
psych::describe(mtcars$mpg)
更多推荐
R语言整体数据描述性统计分析
发布评论