r语言与数据挖掘最佳实践和经典案例数据

编程入门 行业动态 更新时间:2024-10-26 12:33:57

r语言与<a href=https://www.elefans.com/category/jswz/34/1769747.html style=数据挖掘最佳实践和经典案例数据"/>

r语言与数据挖掘最佳实践和经典案例数据

本节书摘来自华章出版社《R语言与数据挖掘最佳实践和经典案例》一 书中的第1章,第1.3节,作者:(澳)Yanchang Zhao,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.3 数据集

本节简单地介绍本书中将要使用到的数据集。

1.3.1 iris数据集

在许多的科研著作中都在iris数据集上做分类操作。该数据集由3种不同类型的鸢尾花的50个样本数据构成 [Frank and Asuncion,2010]。其中的一个种类与另外两个种类是线性可分离的,后两个种类是非线性可分离的。这个数据集包含了5个属性:

Sepal.Length(花萼长度),单位是cm。

Sepal.Width(花萼宽度),单位是cm。

Petal.Length(花瓣长度),单位是cm。

Petal.Width(花瓣宽度),单位是cm。

种类:Iris Setosa(山鸢尾)、Iris Versicolour(杂色鸢尾),以及Iris Virginica(维吉尼亚鸢尾)。

1.3.2 Bodyfat数据集

Bodyfat数据集由mboost包[Hothorn et al.,2012]提供。该数据集包含71行,每一行代表一个客户的信息。数据集包含10列数值型数据。

age:年龄。

DEXfat:以DXA计算的体脂重,响应变量。

waistcirc:腰围。

hipcirc:臀围。

elbowbreadth:肘宽。

kneebreadth:膝宽。

anthro3a:三项人体测量的对数和。

anthro3b:三项人体测量的对数和。

anthro3c:三项人体测量的对数和。

anthro4:三项人体测量的对数和。

DEXfat的值可通过其他的变量预测得到。

更多推荐

r语言与数据挖掘最佳实践和经典案例数据

本文发布于:2024-03-07 17:15:13,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1718416.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:数据挖掘   案例   语言   经典   数据

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!