决策树中使用网格搜索寻找最优参数|电子爱好者

admin管理员组
文章数量:1641864

决策树

决策树是一个树结构（二叉树或非二叉树），其每个非叶节点表示一个特征上的测试，每个分支代表这个特征在某个值域上的输出，每个叶节点存放一个类别。使用决策树进行决策的过程就是从损节点开始，观试待分类项中相应的特征，并按照其值选择输出分支，直到到达叶子节点，然后将叶子节点存放的类别作为决策结果。

决策树模型通过对训练样本的学习，建立分类规则，然后依据分类规则，对新样本数据进行分类预测。决策树是最经常使用的数据挖掘算法，它主要的优点有;
1.易于理解和实现。不需要使用者了解很多的背景知识，其通过决策树就能够直观形象地了解规则。

2.决策树能够同时处理数值型和非数值型数据，能够在相对较短的时间内对大型数据源做出可行且效果良好的预测。

DecisionTreeClassifier函数
在sklearn模块中，使用DecisionTreeClassifier函数进行决策树建模，常用参数如下：
sklearn.tree.DecisionTreeClassifier(critreion = ‘gini’,max_depth = None,max_leaf_nodes = None)

参数	说明
criterion	特征分裂依据指标，默认为gini，可以选择信息熵entory
max_depth	树的最大深度，默认分裂到最细粒度的树结构
max_leaf_nodes	树的最大叶子节点个数，默认分裂到最细粒度的树结构

网格搜索：

它是通过遍历给定的参数组合来优化模型表现的方法。网格搜索从候选参数集合中，选出一系列参数并把他们组合起来，得到候选参数列表。然后遍历参数列表，把候选参数放在模型中，计算得到该参数组合的得分。而后再从候选参数列表中，选择得分最高的参数，作为模型的最优参数。

GridSearchCV函数
在sklearn模块中，使用GridSearchCV函数进行网格搜索，通过交叉验证进行评分。

常用参数
sklearn.model_selection.GridSearchCV(estimator,param_grid,scoring = None,cv = 3,verbose = 0,return_train_score = False,n_jobs = 1)

参数	说明
estmator	要评估的模型
param_grid	参数字典，参数名为key，候选参数列表为value
scoring	评估指标，默认调用estimator.score()函数进行评估
cv	k折交叉验证的次数
verbose	执行过程中调试信息的等级，等级越高，输出信息越多
return_train_score	是否返回训练得分，默认为False，一般需要设置为True
n_jobs	并行运行的模型数，默认为1，可以根据cpu数量设置

下面用具实例体代码来实现。
部分数据如下：

导入相应实例数据：

import pandas as pd 
data = pd.read_csv(
    '../form/决策树.csv',encoding = 'gbk')
    #encoding根据自己文件的编码类型设置，主要的有utf-8,ANSI,gbk等

进行文字独热编码转换：

from sklearn.preprocessing import OneHotEncoder
oneHotColumns = ['性别','父母鼓励']
#需要进行独热处理的列
oneHotEncoder =  OneHotEncoder(drop = 'first')
#新建独热编码器
oneHotEncoder.fit(data[oneHotColumns])
#训练独热编码器，得到转换规则
oneHotData = oneHotEncoder.transform(data[oneHotColumns])
#转换数据

将转换出来的数据进行合并：

from scipy.sparse import hstack
x= hstack([
    oneHotData,
    data.父母收入.values.reshape(-1,1),
    data.IQ.values.reshape(-1,1)
])
y = data['升学计划']

进行网格搜索，寻找最优参数：

from sklearn.model_selection import GridSearchCV
from sklearn.tree import DecisionTreeClassifier
paramGride = dict(
    max_depth = [1,2,3,4,5],
    max_leaf_nodes = [3,5,6,7,8],)
    #网格搜索，寻找最优参数
dtModel = DecisionTreeClassifier()
#新建决策树模型
grid = GridSearchCV(
    dtModel,paramGride,cv = 10,return_train_score = True)
grid = grid.fit(x,y)
#训练模型

输出：

print('best_score：%f'% grid.best_score_)
print('最好的参数:')

for key in grid.best_params_.keys():
    print('%s = %s'%(key,grid.best_params_[key]))

运行代码：

结果显示，最优参数为max_depth =4,max_leaf_nodes = 7

本文标签：网格最优参数决策树

版权声明：本文标题：决策树中使用网格搜索寻找最优参数内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1729329576a1196214.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

决策树中使用网格搜索寻找最优参数

决策树

网格搜索：

更多相关文章

vue3.2版本 在浏览器打开一个新窗口 和 在页面弹出新窗口的写法（传参和接收参数）

windows使用start命令打开浏览器并访问网址时不能正确识别携带多个参数的url(包含&amp;符号)

amd k14主板参数_R5 1400配什么主板好？R5-1400主板搭配与参数详解 (全文)

python设置打印机参数_打印文件并配置打印机设置

BIMBase参数化建库软件使用手册

TEB算法详解 参数详解

计算机型号或配置,查看电脑各项配置参数的方法

自定义类传入priority_queue时第三个参数的用法

c++优先级队列priority_queuecompare成员参数分析

appPackage和appActivity参数获取方法

e2224g处理器参数测评 怎么样

【笔记】入门级All in one系列（一）：AIO主机配置、配件参数

配置一台计算机主要设备的参数指标,计算机系统技术指标及配置

ChapGpt中api接口中各参数的详解

Vue-Router（一）路由配置-页面跳转-子路由-路由传递参数

登录后重定向到原先路由（带参数）

vue 跳转携带的参数如何获取_VUE路由携带参数的三种方式

Vue路由传参及路由参数变化后而页面不刷新的解决

决策树中使用网格搜索寻找最优参数

命令行参数解析picocli快速使用

发表评论

推荐文章

计算机课堂小游戏活跃气氛,活跃气氛课堂互动小游戏大全

联想r720自带杜比驱动下载_暑假追剧补习神器，联想M10 PLUS评测

Java实现文件的加密与解密

腾讯云阿里云服务器搭建java web网站+关于centos常用操作指令

Vue disabled更改无效 disabled bug 网络请求 computed

热门文章

CTF 总结04：win11+冰蝎4.0.6安装[更新中]

Parallels Desktop（PD）安装CentOS7过程遇到的一些问题

Office 2016 Barcode 16.0 控件

mySQL 错误 3167 - The 'INFORMATION_SCHEMA.GLOBAL_STATUS' feature is disabled; see the document

给cad文件加密的软件，CAD文件加密软件哪个好用

哪个文件加密软件好用？透明加密软件推荐

csdn登录不上去或登录卡顿问题处理

青龙面板重启后打不开的解决方案

Win10系统与Win2003服务器的连接问题（win10的Windows功能开启与关闭）

Lebron James Industrial [Video] New Nike 'Rise' Advertisement Gets 500K Views

最新文章

Centos7防火墙开放及查看端口命令

linux防火墙,以及添加端口到防火墙白名单中

【已解决】linux开启端口 error: unrecognized arguments: -add-port=8080tcp

firewalld开放oracle端口

Centos系统，防火墙没开，docker部署的rabbitmq不能外网访问监听端口，但别的端口都能正常访问？？？

firewall-cmd设置ipset简化配置

开启 Firewalld（防火墙） 下需要注意的事

Linux 防火墙永久开放端口

Nginx 配置旧域名重定向到新域名

linux端防火墙指定端口的开和关

Nginx之http自动跳转https及根路径重定向配置

firewall杂记

linux centos7启动防火墙出现“FirewallD is not running”怎么办

解决 windows本地Java项目访问虚拟机中redis服务 访问不成功问题

centos7 阿里云解决redis无法远程连接的问题

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

vue3.2版本在浏览器打开一个新窗口和在页面弹出新窗口的写法（传参和接收参数）

windows使用start命令打开浏览器并访问网址时不能正确识别携带多个参数的url(包含&符号)

TEB算法详解参数详解

e2224g处理器参数测评怎么样

开启 Firewalld（防火墙）下需要注意的事

解决 windows本地Java项目访问虚拟机中redis服务访问不成功问题

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载