admin管理员组文章数量:1650764
排列表示:
importances = model.feature_importances_
indices = np.argsort(importances)[::-1]
feat_labels = X_train.columns
print("Feature ranking:")
# l1,l2,l3,l4 = [],[],[],[]
for f in range(X_train.shape[1]):
print("%d. feature no:%d feature name:%s (%f)" % (f + 1, indices[f], feat_labels[indices[f]], importances[indices[f]]))
print (">>>>>", importances)
画图:
feature_importance = model.feature_importances_
sorted_idx = np.argsort(feature_importance)
features_list = data.columns.values
plt.figure(figsize=(5,20))
plt.barh(range(len(sorted_idx)), feature_importance[sorted_idx], align='center')
plt.yticks(range(len(sorted_idx)), features_list[sorted_idx],)
plt.xlabel('Importance')
plt.title('Feature importances')
plt.draw()
plt.show()
筛选重要程度大于某个值的特征:
#将特征名称与对应的重要性数值做成dataframe
fea = pd.DataFrame()
fea['feature_name'] = feature_name
fea['value'] = feature_importance
fea.loc[fea['value'] >0 ]
#找出重要性为0的特征
fea_0 = fea.loc[fea['value'] == 0 ]['feature_name'].tolist()
fea_0
版权声明:本文标题:筛选重要特征的方法feature_importance_ 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.elefans.com/dongtai/1729533968a1205174.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论