xgboost报错ValueError: feature_names mismatch|电子爱好者

admin管理员组
文章数量:1650822

@创建于：20210107
@修改于：20210107,20210108

文章目录

- - - 1、背景
    - 2、predict()介绍 ( xgboost==0.90)
    - 3、解决办法
    - - 3.1 把validate_features设置为False
      - 3.2 把输入的数据（dataframe类型）的列名进行对应修改
      - 3.3 变更predit输入数据的格式
      - 3.4 思考
    - 4、参考链接

1、背景

XGBClassifier自带fit()、predict()方法。

当通过网格搜索，交叉验证后，获得了最佳的参数，形成模型，并保存。

当再次加载模型，对测试集进行预测时候，使用XGBClassifier自带predict()方法时候，发现出现该问题。即：ValueError(“feature_names mismatch: [‘ntp’, ‘pg’, ‘dbp’, ‘tsft’, ‘si’, ‘bmi’, ‘dpf’, ‘age’] [‘f0’, ‘f1’, ‘f2’, ‘f3’, ‘f4’, ‘f5’, ‘f6’, ‘f7’]\nexpected bmi, age, si, dpf, ntp, dbp, tsft, pg in input data\ntraining data did not have the following fields: f5, f3, f1, f4, f6, f7, f0, f2”,)

2、predict()介绍 ( xgboost==0.90)

（1）用法
predict(self, data, output_margin=False, ntree_limit=None, validate_features=True)

（2）参数及其含义

参数	类型	介绍
data	DMatrix	The dmatrix storing the input.
output_margin	bool	Whether to output the raw untransformed margin value.
ntree_limit	int	Limit number of trees in the prediction; defaults to best_ntree_limit if defined(i.e. it has been trained with early stopping), otherwise 0 (use all trees).
validate_features	bool	When this is True, validate that the Booster’s and data’s feature_names are identical. Otherwise, it is assumed that the feature_names are the same.

3、解决办法

3.1 把validate_features设置为False

预测时候代码为：model_xgb.predict(X_test.values, validate_features=False)，X_test是dataframe格式，X_test.values是ndarray格式。

此时的假设是，模型训练时用的训练数据集的特征名称、特征数据和特征顺序，与验证集的数据特征名称、特征数据和特征顺序完全一致。

在训练集和验证集通过dataframe格式，用train_test_split来划分的时候，是一致的。

3.2 把输入的数据（dataframe类型）的列名进行对应修改

预测时候代码为：model_xgb.predict(X_test.values)，X_test是dataframe格式，X_test.values是ndarray格式。

在数据（以dataframe结构）进行划分之前，对列名进行重命名。重命名为[‘f0’, ‘f1’, ‘f2’, ‘f3’, ‘f4’, ‘f5’, ‘f6’, ‘f7’]形式。这是XGB特征的命名格式。可通过model.get_booster().feature_names进行查看。

# 重命名，与featuer name一致
print('df_tmp columns original names are {}'.format(df_tmp.columns))
rename_dict = dict()
for index, value in enumerate(df_tmp.columns.values):
    rename_dict[value] = "f" + str(index)
df_tmp.rename(columns=rename_dict, inplace=True)
print('df_tmp columns new names are {}'.format(df_tmp.columns))

3.3 变更predit输入数据的格式

X_test是dataframe格式，修改下面代码。

把
y_pred = model_xgb.predict(data=X_test.values)
改成
y_pred = model_xgb.predict(data=X_test)

3.4 思考

（1）predict中的data，要求是DMatrix格式，但可以兼容dataframe格式。
（2）当data是dataframe类型时，XGBoost的特征名称就是列名。
（3）当data是ndarray类型时，XGBoost的特征名称默认是[‘f0’, ‘f1’, ‘f2’]样式。

可修改dataframe的列名成[‘f0’, ‘f1’, ‘f2’]样式；
可把validate_features设置成False。

4、参考链接

（1）解决xgboost报错： ValueError: feature_names mismatch
（2）ValueError：feature_names不匹配
（3）成功解决 ValueError: feature_names mismatch training data did not have the following fields

本文标签：报错 Xgboost ValueError mismatch featurenames

版权声明：本文标题：xgboost报错ValueError: feature_names mismatch 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1729532076a1204936.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

xgboost报错ValueError: feature_names mismatch

文章目录

1、背景

2、predict()介绍 ( xgboost==0.90)

3、解决办法

3.1 把validate_features设置为False

3.2 把输入的数据（dataframe类型）的列名进行对应修改

3.3 变更predit输入数据的格式

3.4 思考

4、参考链接

更多相关文章

WIN10共享打印机报错解决方法

windows 10 21H2 连接网络共享点击报错 0x0000007c

提交到Flink集群上去的时候报错，说是 “无法从JAR文件构建程序 ”、 JobManagerlog负责xxx丢失了领导权、TaskManagerlog心跳超时

ERROR: pip’s dependency resolver does not currently take into account all the packages报错的正确解决方法，亲测有效

linux系统密码正确但是一直登录不了报错Account locked due to failed logins

sourceTree使用报错account has been locked. To unlock it and log in again you mustsolve a CAPTCHA

Spark on k8s提交测试任务失败报错解决办法：User “system:serviceaccount:default:default“ cannot get resource “pods

git提交报错does not match your user account

代码上传报错：ERROR:In commit XXXauthor email address xx@xx.com does not match your user account.

ChatGPT 报错：“Your OpenAi account has been deactivated…”什么原因？如何处理！

gitlab Sign in 报错：You have to confirm your account before continuing.

vue 项目在另一台电脑各种报错

Python 安装 pyclipper 报错 SyntaxError: future feature annotations is not defined

ValueError: Length of feature_names, 4 does not match number of features, 2 的解决方法

opencv 报错：Error: The functionfeature is not implemented () in cv::Feature2D::detectAndCompute, file

保姆式解决使用pyLDAvis对LDA可视化报错问题：‘CountVectorizer‘ object has no attribute ‘get_feature_names‘的问题

xgboost报错ValueError: feature_names mismatch

tfrecord数据报错 InvalidArgumentError: Feature: feature (data type: string) is required but could not

关于xgboost中feature_importances_和xgb.plot_importance不匹配的问题。

ValueError: Items of feature_columns must be a _FeatureColumn. Given (type class 'collections._Indi

发表评论

推荐文章

小米电视刷android系统升级,小米盒子跳升安卓8.0系统：针对电视等大屏产品进一步优化...

小米微信双开开启谷歌服务器,小米10怎么双开微信 具体设置方法分享

使用计算机控制台方法,电脑打开控制面板的几种方法

【Deep Learning】VGG16之feature map学习笔记

python:__feature__模块

热门文章

ubuntu安装微信，QQ等软件

QQ传输协议

阿里软件测试二面：adb 连接 Android 手机的两种方式，看完你就懂了

推荐一款笔记软件 Notion

网络渗透学习第四天

电脑缺失msvcp100.dll怎么修复，msvcp100.dll丢失故障解决方法

spring boot校园商铺系统 毕业设计源码论文+答辩PPT

SpringCloud微服务

手机微信桌面计算机不见了怎么办,微信桌面图标不见了怎么办

我xp电脑桌面没有计算机图标不见了,我的电脑图标没了_xp我的电脑图标没了怎么办-太平洋IT百科手机版...

最新文章

优秀开源杀毒软件ClamAV

赛门铁克下载

Dreamweaver DW CC2019软件下载及安装教程（亲测可用）

Defender杀毒软件冲突 win8系统Defender关闭方法

斑马快传，高效安全的内外网文件传输软件，可穿透网闸服务器杀毒。

电磁仿真软件CST2020 下载链接及安装破·解教程笔记

简单安全的u盘杀毒软件

【软件安装】TeXLive 2022安装（Latex下载，安装，测试，升级）教程

杀毒软件打不开解决办法

STM32开发软件MDK5下载安装步骤

U盘杀毒软件U盘Clear

全网最全！XPS数据分析工具Thermo Avantage下载、安装及使用教程！

Linux查询安装的软件及版本

360 支持linux版本下载地址,360安全卫士linux版下载

瑞星杀毒软件的安装与设置

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

小米微信双开开启谷歌服务器,小米10怎么双开微信具体设置方法分享

python:feature模块

spring boot校园商铺系统毕业设计源码论文+答辩PPT

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载