词频统计"/>
Python入门基础超详细的Hamlet词频统计
程序分析
1.我们准备一个hamlet.txt文件放入到我们的项目中,内容在下方链接: .txt
2.在自定义函数中以只读方式打开,并使用字符替换函数replace()将特殊字符替换成空格。
3.将数据已空格为标志进行切割成列表形式,遍历列表将单词计数存入字典中。这里我们要使用字典中的get()函数,计数时分两种情况:(1)如果当前单词不在字典中则get()函数返回0并加1赋值形成新的键值对。(2)如果当前单词已存在字典中(已存在有键值对)get()函数返回键中的值再加1重新赋值计数。
源码
def getText():file = open("hamlet.txt", "r").read()# 以只读的方式打开文件file = file.lower()# 将文件中的字母全部变为小写for flag in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~':# 将文章中的特殊字符替换成空格并返回file = file.replace(flag, " ")return filefileStr = getText()
words = fileStr.spli
更多推荐
Python入门基础超详细的Hamlet词频统计
发布评论