[Paddle领航团python基础课程大作业一]英文词频的统计任务|电子爱好者

admin管理员组
文章数量:1579393

英文词频的统计任务

- 作业内容
- - 方法一：
  - 方法一代码展示
  - 方法二
  - 方法二代码展示

作业内容

统计英语6级试题中所有单词的词频，并返回一个如下样式的字典

{‘and’:100,‘abandon’:5}

英语6级试题的文件路径./artical.txt

文件下载传送门

Tip: 读取文件的方法

def get_artical(artical_path):
    with open(artical_path) as fr:
        data = fr.read()
    return data

get_artical('./artical.txt')

处理要求

(a) '\n’是换行符需要删除
(b) 标点符号需要处理

['.', ',', '!', '?', ';', '\'', '\"', '/', '-', '(', ')']

['1','2','3','4','5','6','7','8','9','0']

(d) 注意大小写
一些单词由于在句首，首字母大写了。需要把所有的单词转成小写

'String'.lower()

(e) 高分项

通过自己查找资料学习正则表达式，并在代码中使用(re模块)

可参考资料：https://docs.python/3.7/library/re.html

方法一：

1.读取文档

2.处理数据

3.获得词汇

4.获得词频

5.拼接

# 伪代码
# 得到文档内容
def get_artical(artical_path):
    with open(artical_path) as fr:
        data = fr.read()
    return data

get_artical('./artical.txt')

a = ['.', ',', '!', '?', ';', '\'', '\"', '/', '-', '(', ')']
b = ['1','2','3','4','5','6','7','8','9','0'] 

# 处理数据
新数据 = 数据.lower()  # 小写化
自定义变量

# 脏数据的处理
循环 新数据：
    如果 循环的内容 不等于 a, b, '\n':
        得到新的数据

# 获得我们要进行统计词频的数据（方法一）
循环 处理以后的数据：
    查看是否在我们数据的列表
        没有就添加
    否则
        就pass
# 获得的新数据转元组（方法二）
newword = tuple(newdata)


# 统计词频
循环 我们要进行统计词频的数据：
    循环我们处理后的newdata：
        判断单词的次数然后计数
    计数后放进列表

循环 单词的长度（len（newword））：
    把单词和词频匹配并放进字典

方法一代码展示

def get_artical(artical_path):
    # 去读文档
    with open(artical_path) as fr:
        data = fr.read()
    return data

# 需要处理的脏数据
not_1 = ['.', ',', '!', '?', ';', '\'', '\"', '/', '-', '(', ')']
not_2 = ['1','2','3','4','5','6','7','8','9','0'] 

# 读取数据
data = get_artical('./artical.txt')


# 数据小写化，清理脏数据
data = data.lower()
new_data = ''
for i in data:
    if i not in not_1 and i not in not_2 and i

本文标签：词频作业英文课程基础

版权声明：本文标题：[Paddle领航团python基础课程大作业一]英文词频的统计任务内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1727845525a1133042.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

python基础个人总结

1天前

1、Python的可变与不可变不可变类型：数字、字符、元组（一旦改变，变量所指向的地址发生变化）可变类型：列表、字典、集合&am

HUST-多媒体基础PPT目录

23小时前

文章目录多媒体基础理论基础概念...1数字音频基础...2数字图像基础...5计算机动画基础...10数字视频基础...11 多媒体数据的压缩和编码压缩的必要性和可能性...17压缩与编码的分类...21PCM与预测编码...21无损压缩

mysql数据库及应用作业_MySQL数据库设计与应用作业答案

18小时前

Amyway－G&H Body Shampoo G&H Body Shampoo helps skin become clarifying and delicate.Glycerin and We ar

无线路由器的基础配置(一)

17小时前

随着WLAN(无线局域网)、WI-FI(无线高保真)的应用越来越广泛，家庭用户以及小型办公网络对使用WLAN和WI-FI等无线技术接入互联网的需求也越来越多。如何使用和配置一台无线路由器往往是用户最为关心的&#

【作业】网络操作系统知识——Cisco网络设备密码恢复

16小时前

Cisco网络设备密码恢复一，配置物理设置在左下方拖拽出Cisco Router 2811和PC用console缆线连接PC的“rs 232（com接口）”连接Rou

ENSP上各种基础协议的配置

16小时前

以前在思科的PT模拟器上学习基础的网络协议，这次学高级的网络配置，转用到ensp，在ensp上学习了基础的协议的配置，做个笔记，以

网络空间安全导论课程作业

16小时前

备份自用，仅供参考~ 第1章网络空间安全概述 3. 什么是网络空间？为什么网络空间存在严峻的信息安全问题？ 网络空间的定义： 1982年&am

【Linux 网络】网络基础（三）（网络层协议：IP 协议）

16小时前

在复杂的网络环境中确定一个合适的路径。一、TCP 与 IP 的关系 IP 层的核心作用是定位主机，具有将数据从主机 A 发送到主机 B 的能力，但是能力并不能保证一定能够做到&#xff0

ADB安装及使用详解（非常详细）从零基础入门到精通，看完这一篇就够了

14小时前

一、ADB简介 1、什么是adb ADB 全称为 Android Debug Bridge，起到调试桥的作用，是一个客户端-服务器端程序。其中客户端是用来操作的电脑，服务

【基础教学】UiBot的下载、安装与使用

14小时前

鉴于很多小伙伴，可能刚刚关注UiBot，对这个平台还不是很了解，我们准备系统的讲解UiBot的相关操作，方便您对UiBot的认识与使用。目录 1、UiBot软件简介 2、UiBot能为您做什么？ 3、系统环境及配置要求 4、下载与安装

初识Ubuntu16.04到Ubuntu18.04的安装与基础配置(超长警告～）

6小时前

初识Ubuntu16.04到Ubuntu18.04的安装与基础配置初识Ubuntu系统Window10 环境下安装Ubuntu18.04双系统准备工作制作系统盘下载Ubuntu18.04镜像文件下载UltraISO软碟通使用UltralS

HTML5期末考核大作业，个人网站—— 程序员个人简历模板下载HTML+CSS+JavaScript (2)

5小时前

🎉精彩专栏推荐👇🏻👇🏻👇🏻✍️ 作者简介: 一个热爱把逻辑思维转变为

NNDL 作业4：第四章课后题

5小时前

习题4-2 试设计一个前馈神经网络来解决 XOR 问题，要求该前馈神经网络具有两个隐藏神经元和一个输出神经元，并使用 ReLU 作为激活函数． 实现代码&#xff1

java正则表达式基础

5小时前

正则表达式是一个非常强大的工具，它对于字符串的处理提供非常强大的功能。今天这篇文章只是简要的简绍下正则表达式的语法，以及如何在java中应用它。那么什么是正则表达式呢？在百