python统计三国演义中出场次数前20的人物

编程入门 行业动态 更新时间:2024-10-26 15:25:51

python统计三国演义中出<a href=https://www.elefans.com/category/jswz/34/912099.html style=场次数前20的人物"/>

python统计三国演义中出场次数前20的人物

三国演义文本下载

import jiebaarticle = open('三国演义.txt', 'r', encoding='utf-8').read()
words = jieba.lcut(article)
//排除干扰项,可添加
exincludes = ['将军', '却说', '二人', '不可', '荆州', '如此', '不能','商议', '如何', '主公', '军士', '左右', '军马', '引兵','次日', '大喜', '天下', '于是', '东吴', '今日', '不敢','魏兵', '人马', '不知', '汉中', '陛下', '一人', '众将','只见', '蜀兵', '大叫', '上马', '此人', '后人', '城中','背后', '一面', '先主', '太守', '大军', '何不', '然后','忽报', '先生', '夫人', '不如', '先锋', "何故", '江东','原来', '令人', '天子', '赶来', '徐州', '正是', '忽然','下马', '因此', '大败', '未知', '百姓', '成都', '大事','一军', '之后', '起兵', '喊声', '不见', '接应', '引军','进兵', '引军', '军中', '大怒', '大惊', '可以', '谋反','心中', '以为', '军民', '不得', '休走', '帐中', '可得']
nums = {}
//别称
for word in words:if len(word) == 1 or word in exincludes:continueelif word in ['丞相','曹孟德','孟德']:nums['曹操'] = nums.get('曹操', 0) + 1elif word in ['孔明曰', '诸葛亮','卧龙','伏龙','武乡侯','忠武侯','蜀相']:nums['孔明'] = nums.get('孔明', 0) + 1elif word in ['玄德曰', '玄德' , '刘豫州','汉中王','汉昭烈帝','平原相','汉室宗亲','中山靖王之后','刘皇叔']:nums['刘备'] = nums.get('刘备', 0) + 1elif word in ['关公', '云长','寿亭侯','关云长']:nums['关羽'] = nums.get('关羽', 0) + 1elif word in ['都督','周郎','公瑾']:nums['周瑜'] = nums.get('周瑜', 0) + 1elif word in ['飞将','吕温侯','奉先','吕奉先']:nums['吕布'] = nums.get('吕布', 0) + 1elif word in ['常胜将军','子龙','赵子龙']:nums['赵云'] = nums.get('赵云',0)+1else:nums[word] = nums.get(word, 0) + 1
numslist = list(nums.items())
//次数排序
numslist.sort(key=lambda x: x[1], reverse=True)
for i in range(20):word, count = numslist[i]print("{} {}".format(word, count))

 

更多推荐

python统计三国演义中出场次数前20的人物

本文发布于:2024-03-08 16:33:57,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1721456.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:场次   演义   中出   人物   python

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!