feature_importances_ - 从决策树到gbdt|电子爱好者

admin管理员组
文章数量:1650774

在用sklearn的时候经常用到feature_importances_ 来做特征筛选，那这个属性到底是啥呢。

分析gbdt的源码发现来源于每个base_estimator的决策树的
feature_importances_

由此发现计算逻辑来源于cython文件，这个文件可以在其github上查看源代码

而在DecisionTreeRegressor和DecisionTreeClassifier的对feature_importances_定义中

到此决策树的feature_importances_就很清楚了：impurity就是gini值，weighted_n_node_samples 就是各个节点的加权样本数，最后除以根节点nodes[0].weighted_n_node_samples的总样本数。最后还要归一化处理
下面以一个简单的例子来验证下：

上面是决策树跑出来的结果，来看petal width (cm)就是根节点，
f e a t u r e i m p o r t a n c e = ( 112 ∗ 0.6647 − 75 ∗ 0.4956 − 37 ∗ 0 ) / 112 = 0.332825 feature_importance=(112*0.6647-75*0.4956-37*0)/112=0.332825 featureimportance=(112∗0.6647−75∗0.4956−37∗0)/112=0.332825,
petal length (cm)的
f e a t u r e i m p o r t a n c e = ( 75 ∗ 0.4956 − 39 ∗ 0.05 − 36 ∗ 0.1528 ) / 112 = 0.26535 feature_importance=(75*0.4956-39*0.05-36*0.1528)/112=0.26535 featureimportance=(75∗0.4956−39∗0.05−36∗0.1528)/112=0.26535
归一化：
0.332825 / ( 0.332825 + 0.26535 ) = 0.5564007189 0.332825 / (0.332825+0.26535)=0.5564007189 0.332825/(0.332825+0.26535)=0.5564007189
0.26535 / ( 0.332825 + 0.26535 ) = 0.4435992811 0.26535/ (0.332825+0.26535)=0.4435992811 0.26535/(0.332825+0.26535)=0.4435992811

忽略图上gini计算的小数位数，计算结果相同。

本文标签：决策树 gbdt

版权声明：本文标题：feature_importances_ - 从决策树到gbdt 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1729533433a1205105.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

feature_importances_ - 从决策树到gbdt

更多相关文章

机器学习课后习题答案

机器学习课后习题答案(周志华)

jupyter决策树编程代码

广告节目制作网病毒防治

决策树遇到sklearn.exceptions.NotFittedError: XXX instance is not fitted yet. Call 'fit' with appropriate ...

自己动手写决策树（一）——初步搭建决策树框架

决策树流程_实施更智能的流程决策

【数据挖掘】数据挖掘、关联分析、分类预测、决策树、聚类、类神经网络与罗吉斯回归

python-机器学习-决策树实现

决策树中使用网格搜索寻找最优参数

决策树（三）--完整总结（ID3，C4.5，CART,剪枝，替代）

【机器学习(二)】分类和回归任务-决策树(Decision Tree,DT)算法-Sentosa_DSML社区版

【机器学习(四)】分类和回归任务-梯度提升决策树(Gradient Boosting Decison Tree,GBDT)算法-Sentosa_DSML社区版

构建决策树时出现ValueError: Length of feature_names, 4 does not match number of features, 10的解决办法

决策树-随机森林-两种Feature importances排序方法

feature_importances_ - 从决策树到gbdt

GBDT、XGboost、lightGBM 之feature_importances_ 的计算方法

发表评论

推荐文章

【好玩的小demo】微信&amp;QQ聊天数据统计分析

小米Miui线刷步骤记录

osi模型:七层模型介绍_联网| OSI模型能力问题和解答 套装4

Linux--用Docker部署开源建站工具——Halo，且实现个人博客公网访问--含Docker安装和定义

常用运行代码记录（控制面板，命令行等）

热门文章

CentOS7修改配置文件后导致报错“ sudo：PAM account management error：Permission denied ”，su root 报错：“su：Permission”

Java 编写一个类实现银行账户Account的概念，包含的属性有“帐号”、“密码”、“存款余额”、“利率rate”、“最小余额”，定义封装这些属性的方法。

ORA-28000: the account is locked 的解决办法！

selenium与360极速浏览器driver配置

U盘mp3移动硬盘“文件或目录损坏且无法读取”错误的修复

adb: error: failed to get feature set: more than one deviceemulator

feature_importances_ - 从决策树到gbdt

ECharts 使用toolbox.feature.saveAsImage.type设置图片导出格式

解决TensorFlow installation not found - running with reduced feature set的一种可能方法

ssm南工二手书交易平台毕业设计源码172334

最新文章

转载win7(windows7旗舰版)声卡High Definition Audio驱动不能安装(安装失败）解决方案

服务器如何开启电脑的虚拟化技术,win7怎么打开vt虚拟化技术|win7在bios开启vt虚化的方法...

windows7的用户账户控制每次重启计算机时都会被关闭,win7系统更改设置总是弹出用户账户控制的解决方法...

驰为vi10旗舰版linux,驰为Vi10平板电脑完全安装Win10步骤 BY Chinasred

windows7系统屏幕一直闪屏的解决教程

win7系统打印机开启服务器,开启打印机服务【设置模式】

服务器真在运行中,win7电脑服务器正在运行中的解决教程

windows 从命令行启动进入系统

计算机文件预览取消,关闭视频文件预览，保留图片文件预览（windows7） -电脑资料...

Win7 64位旗舰版系统取消电脑开机自动检测硬盘的方法

iwork8旗舰版 android,小身材大不凡 酷比魔方iWork8旗舰版评测

windows7 64位旗舰版 完美安装64位Oracle11g+32位plsql

windows7现实计算机内存不足,win7 64位有剩余空间却提示内存不足的解决方法

Windows7共享文档—开启方法及用户权限设置

计算机管理记事本,win7旗舰版系统下自带记事本的强大功能汇总【图文详解】...

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

【好玩的小demo】微信&QQ聊天数据统计分析

osi模型:七层模型介绍_联网| OSI模型能力问题和解答套装4

iwork8旗舰版 android,小身材大不凡酷比魔方iWork8旗舰版评测

windows7 64位旗舰版完美安装64位Oracle11g+32位plsql

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载