一栏中包含多个标签的热编码

编程入门 行业动态 更新时间:2024-10-27 13:33:12
本文介绍了一栏中包含多个标签的热编码的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧! 问题描述

我有一个简单的数据集.

I have a simple dataset.

id,question,category,tags,day,quarter,group_id 1,What is your name,Introduction,Introduction,1,3,0 2,What is your name,Introduction,"Introduction, work",1,3,1

现在,如果看到的话,在 tags 列中,有多个输入用逗号分隔.如果我尝试使用 pandas get_dummies 函数进行一次热编码,那么我会将其作为单列显示.但是我想为每个标签创建列.我该怎么办?

Now if you see, in the tags column there are multiple inputs seperated by commas. If I try to one-hot-encode using pandas get_dummies function I will get that as a single column. But I wanted to create columns for each tags. How can I do that possibly?

推荐答案

我认为需要 str.get_dummies :

I believe need str.get_dummies:

df1 = df['tags'].str.get_dummies(', ') print (df1) Introduction work 0 1 0 1 1 1

更多推荐

一栏中包含多个标签的热编码

本文发布于:2023-10-14 19:05:14,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1491937.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:多个   栏中   标签

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!