python做频数分析"/>
用python做频数分析
功能
不多说,直接上图。
词频分析结果
输入文章,输出词频结果。
工具
Python、jieba
步骤
1、安装jieba库。
pip install jieba
2、 导入引用,并读取文件。
import jieba
txt_f = open('./七月与安生.txt')
s = txt_f.read()
txt_f.close()
3、用jieba库进行分词,并统计各个词的频率。
seg_list = jieba.cut(s)
dict_list = {}
for seg in seg_list:
if(dict_list.get(seg) != None):
dict_list[seg] += 1
else:
dict_list[seg] = 1
4、 对每个词进行频率大小排序。
sort_list = sorted(dict_list.items(), key=lambda item: item[1], reverse=True)
5、 以csv格式写入文件,输出结果保存在output文件夹内。
f = open("./output/StatisticsSorted.csv", mode='w')
for item in sort_list
更多推荐
用python做频数分析
发布评论