R语言整体数据描述性统计分析

编程入门 行业动态 更新时间:2024-10-22 22:49:19

R语言整体数据描述性<a href=https://www.elefans.com/category/jswz/34/1763861.html style=统计分析"/>

R语言整体数据描述性统计分析

R语言整体数据描述性统计分析

在这里主要对连续性变量进行整体统计性分析,包括最大最小值、中位数、均值、方差等统计量,但是这里不会分别进行分析计算,而是使用一个函数进行自动统计。

1、summary

该函数是R语言自带的函数,不需要安装任何包,summary()函数提供了最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计。

分行分列统计数据还可以使用apply()系列函数,详情请点击:apply系列函数

summary(mtcars)

该函数虽然简单易用,但是统计的内容有限,下面将介绍其他用于统计分析的函数。

2、 stat.desc()

pastecs 包中有一个名为 stat.desc() 的函数,它可以计算种类繁多的描述性统计量。使用
格式为:stat.desc(x, basic=TRUE, desc=TRUE, norm=FALSE, p=0.95)

  • x 是一个数据框或时间序列
  • basic=TRUE (默认值),则计算其中所有值、空值、缺失值的数量,以及最小值、最大值、值域,还有总和
  • desc=TRUE (同样也是默认值),则计算中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、方差、标准差以及变异系数
  • norm=TRUE (不是默认的),则返回正态分布统计量,包括偏度和峰度(以及它们
    的统计显著程度)和Shapiro-Wilk正态检验结果。
install.packages("pastecs")
library(pastecs)
pastecs::stat.desc(mtcars,norm = TRUE)

该函数课统计的内容包括最小值、最大值、值域、总和、中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、方差、标准差、变异系数、正态分布统计量(包括偏度和峰度(以及它们 的统计显著程度)和Shapiro-Wilk正态检验结果)。

3、describe

psych包拥有一个名为describe()` 的函数,它可以计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误。

install.packages("psych")
library(psych)
psych::describe(mtcars$mpg)

更多推荐

R语言整体数据描述性统计分析

本文发布于:2024-03-10 14:50:34,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1728270.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:统计分析   语言   数据

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!