XGBoost解决多分类问题|电子爱好者

admin管理员组
文章数量:1658707

XGBoost解决多分类问题

写在前面的话

XGBoost官方给的二分类问题的例子是区别蘑菇有无毒，数据集和代码都可以在xgboost中的demo文件夹对应找到，我是用的Anaconda安装的XGBoost，实现起来比较容易。唯一的梗就是在终端中运行所给命令： ../../xgboost mushroom.conf 时会报错，是路径设置的问题，所以我干脆把xgboost文件夹下的xgboost.exe拷到了mushroom.conf配置文件所在文件夹下，这样直接定位到该文件夹下就可以运行： xgboost mushroom.conf。二分类数据预处理，也就是data wraggling部分的代码有一定的借鉴意义，值得一看。多分类问题给的例子是根据34个特征识别6种皮肤病，由于终端中运行runexp.sh没有反应，也不报错，所以我干脆把数据集下载到对应的demo文件夹下了,主要的代码如下，原来有部分比较难懂的语句我自己加了一些注释，这样理解起来就会顺畅多了。
[python] view plain copy

#! /usr/bin/python
import numpy as np
import xgboost as xgb
# label need to be 0 to num_class -1
# if col 33 is '?' let it be 1 else 0, col 34 substract 1
data = np.loadtxt('./dermatology.data', delimiter=',',converters={33: lambda x:int(x == '?'), 34: lambda x:int(x)-1 } )
sz = data.shape
train = data[:int(sz[0] * 0.7), :] # take row 1-256 as training set
test = data[int(sz[0] * 0.7):, :] # take row 257-366 as testing set
train_X = train[:,0:33]
train_Y = train[:, 34]
test_X = test[:,0:33]
test_Y = test[:, 34]
xg_train = xgb.DMatrix( train_X, label=train_Y)
xg_test = xgb.DMatrix(test_X, label=test_Y)
# setup parameters for xgboost
param = {}
# use softmax multi-class classification
param['objective'] = 'multi:softmax'
# scale weight of positive examples
param['eta'] = 0.1
param['max_depth'] = 6
param['silent'] = 1
param['nthread'] = 4
param['num_class'] = 6
watchlist = [ (xg_train,'train'), (xg_test, 'test') ]
num_round = 5
bst = xgb.train(param, xg_train, num_round, watchlist );
# get prediction
pred = bst.predict( xg_test );
print ('predicting, classification error=%f' % (sum( int(pred[i]) != test_Y[i] for i in range(len(test_Y))) / float(len(test_Y)) ))
# do the same thing again, but output probabilities
param['objective'] = 'multi:softprob'
bst = xgb.train(param, xg_train, num_round, watchlist );
# Note: this convention has been changed since xgboost-unity
# get prediction, this is in 1D array, need reshape to (ndata, nclass)
yprob = bst.predict( xg_test ).reshape( test_Y.shape[0], 6 )
ylabel = np.argmax(yprob, axis=1) # return the index of the biggest pro
print ('predicting, classification error=%f' % (sum( int(ylabel[i]) != test_Y[i] for i in range(len(test_Y))) / float(len(test_Y)) ))

结果如下： [python] view plain copy

[0] train-merror:0.011719 test-merror:0.127273
[1] train-merror:0.015625 test-merror:0.127273
[2] train-merror:0.011719 test-merror:0.109091
[3] train-merror:0.007812 test-merror:0.081818
[4] train-merror:0.007812 test-merror:0.090909
predicting, classification error=0.090909
[0] train-merror:0.011719 test-merror:0.127273
[1] train-merror:0.015625 test-merror:0.127273
[2] train-merror:0.011719 test-merror:0.109091
[3] train-merror:0.007812 test-merror:0.081818
[4] train-merror:0.007812 test-merror:0.090909
predicting, classification error=0.090909

不管是直接返回诊断类型，还是返回各类型的概率，然后取概率最大的那个对应的类型的index，结果都是一样的。

结语

强烈建议大家使用python notebook来实现代码，当有不明白的代码时看一下执行后的结果能帮助我们很快理解。同时要感叹一下，看大神们的代码感觉好牛X，对我这个XGBoost paper看过两遍还没能完全领略算法精髓的人来说只能拿来主义了，希望后面有机会去读一读算法源码。

本文标签： Xgboost

版权声明：本文标题：XGBoost解决多分类问题内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1729814239a1213704.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

XGBoost解决多分类问题

XGBoost解决多分类问题

写在前面的话

结语

更多相关文章

第100+16步 ChatGPT学习：R实现Xgboost分类

史上最详细的XGBoost实战

Linux下安装Xgboost(python2.7)以及anaconda下 安装xgboost

xgboost交叉验证以及n_jobs报错

windows7和windows10下安装xgboost

shap-Basic SHAP Interaction Value Example in XGBoost

xgboost的特征重要性feature_importance计算

xgboost报错ValueError: feature_names mismatch

xgboost feature_names mismatch处理方法

解决xgboost报错 ： ValueError: feature_names mismatch

成功解决xgboost.core.XGBoostError: b‘[14:48:08] 0 feature is supplied. Are you using raw Booster inter

关于xgboost中feature_importances_和xgb.plot_importance不匹配的问题。

GBDT、XGboost、lightGBM 之feature_importances_ 的计算方法

XGBoost解决多分类问题

xgboost原理及应用

XGBOOST从原理到实战：二分类 、多分类

LightGBM、XGBoost参数调优，调参经验 ，参数介绍

发表评论

推荐文章

electron仿制百度网盘客户端2(登录界面制作)

Windows10自动登录的设置

HarmonyOS系统应用开发基础入门

[良心干货]Windows实用软件推荐第一期，总有一款是你必备的

VMware ESXi 8.0U3 macOS Unlocker &amp; OEM BIOS 集成网卡驱动 Marvell AQC 网卡定制版

热门文章

人工智能学习与实训笔记（十）：百度对话大模型ERNIE调用实操

2.SVN下载及其安装配置（Windows），SVN中文语言包的安装

VMware虚拟机不能识别U盘

苹果市场金融类app上架ios1.2 ,5.2.1或3.21被拒原因解析

软件工程实践——软件评测作业

2024年关于联软UniAccess安全助手流氓行为,导致代码编译失败(2)，211本硕如何通过字节跳动、百度、美团网络安全面试

做自己的救世主——系统安全保卫战

全面解析：oa系统是什么？有哪些好用的oa系统

【粉丝福利社】Premiere Pro 2024从入门到精通(全彩印刷)（文末送书-进行中）

dotnet 从入门到放弃的 500 篇文章合集

最新文章

ucrtbase.dll异常0xc0000409全面透析：成因、影响与高级应对策略

Windows 7系统中快捷方式箭头的隐藏技巧

程序员把妹指南之修电脑篇

win2008r2 惠普g160鼠标_惠普电脑装win7键盘鼠标不能用解决方法全集(支持8910代cpu usb)...

启动应用程序出现ntoskrnl.exe找不到问题解决

电脑出现蓝屏提示0xc0000001错误的解决办法，解决错误代码0xc0000001

d3dcompiler_43.dll不见了怎么办？五种实战技巧助你顺利启动游戏与应用

如何解决 D3DCompiler_42.dll 丢失，这5个方法可以解决 D3DCompiler_42.dll 丢失

basesrv.dll文件丢失导致程序无法运行问题

sc.exe文件丢失导致程序无法运行问题

msrd3x43.dll文件详解：下载方法与常见问题解决方案

计算机中丢失MSVCP140.dll无法启动此程序怎么办

《黑神话：悟空》游戏缺少AkSynthOne.dll文件，解决黑神话悟空AkSynthOne.dll丢失问题的几个方法

计算机缺少d3dx9_42.dll,我家电脑里缺少d3dx9_42.dll怎么处理?

内核错误怎么解决？Win11系统内核错误解决方法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

Linux下安装Xgboost(python2.7)以及anaconda下安装xgboost

解决xgboost报错： ValueError: feature_names mismatch

XGBOOST从原理到实战：二分类、多分类

LightGBM、XGBoost参数调优，调参经验，参数介绍

VMware ESXi 8.0U3 macOS Unlocker & OEM BIOS 集成网卡驱动 Marvell AQC 网卡定制版

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载