gensim的LDA做文档主题分类的练习 模型加载和预测

编程入门 行业动态 更新时间:2024-10-07 16:24:12

gensim的LDA做文档主题分类的练习 <a href=https://www.elefans.com/category/jswz/34/1771358.html style=模型加载和预测"/>

gensim的LDA做文档主题分类的练习 模型加载和预测

主题模型是个无监督的学习方法

这里简单记录一下 用Gensim的lda 进行文档进行主题模型分类的一个小小的练习及其 预测 

可以简单理解  lda就是训练2个分布  一个是文档到主题的分布概率  和主题到单词的分布概率  文档到单词的分布概率是一直的

不断挑战预期 

具体理论细节可以参考这篇博客

 

 

gensim代码实现训练主题模型

"""
LDA模型应用:一眼看穿希拉里的邮件
我们拿到希拉里泄露的邮件,跑一把LDA,看看她平时都在聊什么。首先,导入我们需要的一些库
"""
import numpy as np
import pandas as pd
import re"""
然后  
处理邮件 读取数据 
"""
df=pd.read_csv('./input/HillaryEmails.csv')
#原邮件数据中有很多Nan的值,去掉
df=df[['Id','ExtractedBodyText']].dropna()"""

更多推荐

gensim的LDA做文档主题分类的练习 模型加载和预测

本文发布于:2024-02-13 10:59:27,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1758043.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:模型   加载   文档   主题   gensim

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!