python爬虫入门——13行代码制作英语翻译器教程，小白入门一点通|电子爱好者

admin管理员组
文章数量:1566355

有些同学一想到爬虫，就觉得很厉害，然后也认为是一个很难学，确实，会爬虫的确是个狠人，爬虫这个东西可以抓取很多东西，但是也并不是那么的难学，入门其实也很简单，爬虫都是一些套路步骤，那么接下来让我们用13行代码制作一个简单的英语翻译器来走进爬虫世界。

本文章只进行了终端代码的教程和图形化tkinter演绎视频，若想要图形化翻译器代码请评论区回复，那么废话不多说，底层基础咱也不多说了，直接上干粮。

1.爬虫第一步先import requests,requests是对网址发出请求，如果没有requests的要先在终端pip install requests,如果终端提示没有pip的话那就先去文件夹找到pip.exe的绝对路径，复制绝对路径到环境变量的path中，配置环境变量我就不详细多说了。

import requests #import requests

2.第二步：很关键的一步，打开浏览器搜索百度翻译（也可以是其他翻译器），进入后按键盘上的F12，然后根据下面的截图步骤获取得到请求URL：https://fanyi.baidu/sug

获取表单数据内容的kw：dog

获取URL后编写的代码如下：

url='https://fanyi.baidu/sug' #定义变量url等于获取的网址

获取的表单数据内容放入集合里的代码如下：

dat={
        'kw': 'dog' #这里就是集合的定义了，kw是键，dog是值，dat为集合的变量名
    }

因为dog是我们在网页上输入要翻译的单词，这里我们可以是其他单词，即我们可以通过键盘输入单词来翻译，改进代码如下：

word=input('输入内容：')
dat={
        'kw': word #这里将dog替换成word即可
    }

3.第三步：则是用requests发起请求了，这里说一下关于请求的相关内容，requests有两种请求，一种是get请求，即requests.get(),第二种是post请求，即requests.post(),这两种请求用哪一个可以看上面图片的'请求URL'下面显示有请求方法，所以这次请求方法用requests.post()。

req=requests.post(url,data=dat) #发出请求，这里的url和dat就是上面两个代码的url和dat

接下来是获取得到请求后的数据，post的请求方法我们一般是用json获取数据，即上面代码变量名req.json()或用text获取数据，即req.text,然后还要转化成字符串形式再通过正则表达式获取到具体数据，获取数据的代码如下：

不用正则表达式的完整代码及运行结果如下：

import requests

url='https://fanyi.baidu/sug'
word=input('输入内容：')
dat={
        'kw': word
    }
req=requests.post(url,data=dat)
result1=str(req.json()) #通过json()获取得到数据后转化成字符串
print('翻译为：',result1) #输出结果

巧用正则表达式后的完整代码及运行结果如下：

import requests
import re #要用正则表达式需引入re库

url='https://fanyi.baidu/sug'
word=input('输入内容：')
dat={
        'kw': word
    }
req=requests.post(url,data=dat)
result1=str(req.json())
reg=repile("'v': '(?P<word>.*?)'}") #这行和下面两行代码下个步骤再做解释
result2=reg.search(result1) 
print('翻译为：',result2.group(word))

4.针对上面的几行代码做解答：

（1）reg=repile("'v': '(?P<word>.*?)'}")的讲解

1.'v': '表示下图没有用正则表达式输出的结果中“dog”后面的'v': '

2. '}表示下图没有用正则表达式输出的结果中“跟踪”后面的'}

3. (?P<word>.*?)这个整体的.*?则表示下图输出结果中处于'v': '和'}中间部分的内容，即是上图的运行结果的内容，而?P<word>表示将.*?内容赋给word，便于后面将内容输出在控制台上

（2）result2=reg.search(result1)的解释，这里我只要得到下图结果中第一个大括号{}中的内容，所以用的是search方式得到正则表达式解析后的内容，如果想得到下面所有{}中的内容可以用finditer迭代器方式得到，当然也不止是这两种方法得到内容，大家可以自己去查阅资料了解更多。

（3）print('翻译为：',result2.group(word))解释，通过group得到word变量的内容并输出

5.tkinter图形化翻译器视频演示如下：

图形化也仅用了40行代码写出来

5.总结：

打开浏览器进入翻译器页面，输入单词后得到sug的URL网址和表单数据内容
用requests中post请求方法和json得到数据
通过正则表达式解析后得到最终翻译的内容

本文标签：翻译器入门爬虫英语点通

版权声明：本文标题：python爬虫入门——13行代码制作英语翻译器教程，小白入门一点通内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1726844100a1086870.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

python爬虫入门——13行代码制作英语翻译器教程，小白入门一点通

更多相关文章

python爬虫：爬取全国航班信息

学术英语期末考试

java爬虫框架——jsoup的简单使用（爬取电影天堂的所有电影的信息，包括下载的链接）

计算机英语作文初中,初中关于电脑的英语作文

电脑编程自学(零基础自学编程怎么入门)

计算机网络的对学生的利弊英语作文,关于电脑利弊的英语作文

js判断是否是搜索引擎（蜘蛛）、爬虫

浅谈屏蔽搜索引擎爬虫（蜘蛛）抓取索引收录网页的几种思路

robot.txt搜索引擎蜘蛛爬虫 搜索规则

Android 车载应用开发指南（2）- 应用开发入门

Python爬虫-爬取手机应用市场中APP下载量

Windows 商店应用开发入门指南（一）

【Python】如何监控Python爬虫进程，实现异常重启或异常通知？

爬虫技术系统性总结

【爬虫篇】Playwright的使用——支持移动端浏览器（模拟爬取手机网页）

Nginx入门、下载安装启动（Win10）、常用配置

地底爬虫人访谈

Windows下Pytorch入门深度学习环境安装与配置（CPU版本）

Git入门到精通

英语词根词缀记忆法

发表评论

推荐文章

【Qt】linux下qt程序打包无法识别键盘、无法输入中文问题

IDEA使用破解包后卸载重装或更新后无法启动问题

Ubuntu安装谷歌浏览器（15.04版本，deb亲试成功）

WIN7 插上移动硬盘无法重启

inventor2019有无CAE_Inventor2019最新下载_Inventor2019正式版 - 软件帝

热门文章

mac新手教程——怎么移除或卸载第三方输入法

The POODLE attack (SSLv3 supported) 漏洞修复

关闭计算机选项中没有休眠,win7系统电脑没有休眠功能的解决方法

练习：插⼊优盘，读取优盘数据、在vmware配置光盘iso⽂件，在linux系统中读取光盘⽂件、配置阿⾥云yum仓库、配置清华镜像仓库、配置腾讯镜像仓库、⾃建仓库

一把子教会你MySQL的完全卸载和重装

JVM——运行时数据区、双亲委派模型、垃圾回收算法、垃圾收集器

【数据库】MongoDB数据库详解

SAP学习笔记

docker安装AriaNg下载器

如何在Mac电脑上优雅地使用Windows？(Parallels Desktop 15 中文版下载 - Mac 系统最强虚拟机)

最新文章

使用selenium启动谷歌Chrome浏览器

最好用的chrome 浏览器翻译插件(附下载链接)

如何离线更新安装chrome浏览器

Chrome 浏览器下载速度慢？一个开关就可解决

华硕 ROG 幻142023GA402X原装Windows11预装系统工厂模式恢安装带 ASUSRecevory 一键还原

【Linux】Linux下怎么下载安装Chrome？

如何清除chrome浏览器缓存

如何下载与Chrome浏览器的版本相匹配的ChromeDriver

&quot;Chrome浏览器下载Word、Excel、PPT，打开提示错误&quot;问题

贝壳一键还原1.0 使用详解

Chrome视频下载插件–Video Downloader for Chrome

ubuntu下载各个版本chrome方法

2022 chrome离线下载包

老毛桃一键还原

Windows Server 2008 R2 备份与恢复详细实例

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

robot.txt搜索引擎蜘蛛爬虫搜索规则

"Chrome浏览器下载Word、Excel、PPT，打开提示错误"问题

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载