sklearn处理有String类型的数据

编程入门 行业动态 更新时间:2024-10-13 00:34:13

sklearn处理有String<a href=https://www.elefans.com/category/jswz/34/1771355.html style=类型的数据"/>

sklearn处理有String类型的数据

sklearn处理有String类型的数据

  • 因为老师给的数据中既有数值型也有字符串类型的数据,用sklearn的时候会有"ValueError: could not convert string to float"的错误,意识到sklearn能直接处理的只有数值型的数据,花了一下午时间终于找到了一些一些解决方法。
    附上链接:数据预处理
    sklearn的决策树能够处理字符串数据吗
    一个讨论帖

最后自己的实现代码如下:

import graphviz
import pandas as pd
from sklearn import tree
from sklearn.model_selection import train_test_splitfilename = 'crx.data'
re = pd.read_csv(filename)
data = re.dropna(axis=0, how='any')data_symbol = data.iloc[:, 0:15]
data_target = data.iloc[:, 15]
# d = pd.get_dummies(data, sparse=True)
# print(data_symbol)
# print(data_target)
symbol = pd.get_dummies(data_symbol, sparse=True)Xtrain,Xtest,Ytrain,Ytest = train_test_split(symbol,data_target,test_size=0.3)
# print(Xtrain)
# print(Xtest)
clf = tree.DecisionTreeClassifier()clf = clf.fit(Xtrain,Ytrain)
score = clf.score(Xtest,Ytest)dot_data = tree.export_graphviz(clf,class_names=["+","-"],filled=True,rounded=True)graph = graphviz.Source(dot_data)graph.view()

部分数据如下,col16为分类标签

最后的决策树:

感觉特征标签应该再定义一下,之后应该会不断改进

更多推荐

sklearn处理有String类型的数据

本文发布于:2024-02-10 22:27:29,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1677646.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:类型   数据   sklearn   String

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!