【python爬虫】批量识别pdf中的英文，自动翻译成中文上|电子爱好者

admin管理员组
文章数量:1590495

不管是上学还是上班，有时不可避免需要看英文文章，特别是在写毕业论文的时候。比较头疼的是把专业性很强的英文pdf文章翻译成中文。我记得我上学的时候，是一段一段复制，或者碰到不认识的单词就百度翻译一下，非常耗费时间。本文提供批量识别pdf中英文的方法，后续文章实现自动pdf英文转中文文档，敬请期待。

文章目录

- 一、安装pdfplumber库
- 二、识别单个pdf的内容
- - 1 识别单页的内容
  - 2 识别所有页的内容
- 三、识别文件夹中所有pdf的内容

一、安装pdfplumber库

识别pdf中的内容，需要用到pdfplumber库，所以首先安装pdfplumber库，常规代码如下：

pip install pdfplumber

但是在安装过程会报如下错误：

上网找了一下资料，发现可以使用国内的镜像进行安装

国内的一些pip源：
阿里云 http://mirrors.aliyun/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu/simple/
豆瓣(douban) http://pypi.douban/simple/
清华大学 https://pypi.tu

本文标签：爬虫英文中文批量翻译成

版权声明：本文标题：【python爬虫】批量识别pdf中的英文，自动翻译成中文上内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1728085033a1144873.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

实现音乐自由——免费听（全网音乐）+歌单批量下载MP3方法（某易云）

2天前

目录概要一、免费听二、歌单批量下载（针对某云） 1.如果你是vip 2.非vip 2.1 NetEaseCloudMusic-nonmembership-list-downloa

Python爬虫实战：多线程爬取配乐网，实现异步下载

2天前

目录效果环境和外部库问题与解决办法代码相关知识讲解完整代码结语获取更多实战项目，请关注公众号青云学斋： 效果先来看看运行效果：多线程异步下载会非常轻松的帮你完成下载

FL Studio24.1.1.4239官方中文破解版下载安装使用指南

2天前

FL Studio24.1.1.4239官方中文破解版是一款功能强大的数字音频工作站（DAW），它广泛应用于音乐创作和音乐制作领域。在使用FL Studio时&#xf

【Python爬虫】爬取网易云音乐，打造音乐下载器

2天前

目录搭建窗口爬虫实现下载音乐歌曲搜索下载歌曲绑定命令生成可执行文件感想在前一篇文章，正好总结过了Tkinter以及canvas画布的使用，学以致用，用T

Python爬虫——利用新浪微盘下载周杰伦的歌曲（共190首）

2天前

本篇分享将实现在新浪微盘上下载周杰伦的歌曲，一共190首，下载的网页网址为http:vdisk.weibosarjVBmagFKiLy，页面如下&#xff1a

跟《经济学人》学英文：2024年6月29日这期 A new lab and a new paper reignite an old AI debate

1天前

A new lab and a new paper reignite an old AI debate Two duelling visions of the technological future 对技术未来的两个对立的愿景 rei

跟《经济学人》学英文：2024年08月03日这期 Vienna’s social housing, lauded by progressives, pushes out the poor

1天前

Vienna’s social housing, lauded by progressives, pushes out the poor The city’s most hard-up rely on the private sector

用英文介绍伦敦：London The Empire MEGACITY

1天前

London: The Empire MEGACITY Link: https:www.youtubewatch?vZM7TBKD3a5U London is the capital of the United Kingdom a

Bit manupulation in JS英文

1天前

Common Bit Manipulation Problems The most common bit manipulation problem is likely checking if a number is a power of

ArcMap拓扑检查缝隙，使用Eliminate批量处理消除，就近合并属性

1天前

(1条消息) ArcMap进行Topology（拓扑）检查_迟宏庆的博客的博客-CSDN博客问题描述：在拓扑检查使用规则不能有缝隙过程后，产生大量的

Windows系统批量禁用Defender杀毒软件

1天前

Windows系统批量禁用Defender杀毒软件文章目录 Windows系统批量禁用Defender杀毒软件前言一、禁用方式二、禁用脚本总结前言由于工作需要，需要在windows系统上永久禁用windows

从60%到11%‼️中文同义句在线转换器

1天前

大家好，今天来聊聊中文同义句在线转换器，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧： 中文同义句在线转换器是一种

Linux常用命令英文全称与中文解释 (pwd、su、df、du等)

1天前

apt： Advanced Packaging Tool 高级包装工具 cp: Copy file 复制文件 cat: Concatenate 串联 cd：Change director

mac免费CAD模型设计软件FreeCAD怎样设置中文模式

1天前

Freecad for Mac是一款简单实用的3D cad建模软件，界面简洁，功能强大，Freecad Mac版具有模块化软件架构，还有很多2D组件。m

WIN7中文专业版安装英文语言包的方法

1天前

WIN7中文专业版安装英文语言包的方法 2013-05-26 11:49:26| 分类： 电脑知识 | 标签：win7 英文语言包安装 |举报 |字号大中小订阅突然决定将操

win7系统DOS不显示中文或乱码

1天前

配置完JAVA环境，测试的时候发现，dos里不显示中文，百度到网上的方法，其中一种是打开注册表在console目录下添加下面文件夹&#xff0c

学Python爬虫，不看看m3u8文件如何加密？i春秋 m3u8 文件加密解析

6小时前

文章目录 ⛳️ 实战场景⛳️ digest 实战扣取过程⛳️ 实战场景本次实战目标站点为 https:www.ichunqiucoursesqmxc，随机寻找一门课程点击播放，然后通过开发者工具获取视频文件地址。这次我们测试

ghost网络克隆功能实现【批量】计算机操作【系统的安装】,网络学习（三十）通过ghost的网络克隆功能实现操作系统的分发...

1小时前

通过ghost的网络克隆功能实现操作系统的分发我们在进行ghost网络克隆实验时，要求被ghost网络克隆的计算机硬件应该是相同的，也就是说同一类型的计算机，不然ghost

iMazing 3.0.3.1Mac中文破解版下载安装激活

10分钟前

今天，小编要分享的是Mac下一款可以帮助用户管理IOS设备的软件——iMazing，之前，小编也分享的过类似的软件，iMazing却有独特之处。小子这次

FL Studio24.1.1.4285最新中文破解版下载 2024年最新附带补丁器激活码

7分钟前

嘿，亲爱的音乐制作小伙伴们！今天我要跟你们分享一款让我心动不已的神秘利器 —— FL Studio 24.1.1.4285 中文版。想象一下，一个全能的音乐工作站就像你口袋里

电子爱好者 - 最新技术资讯及电子产品介绍！

【python爬虫】批量识别pdf中的英文，自动翻译成中文上

文章目录

一、安装pdfplumber库

更多相关文章

实现音乐自由——免费听（全网音乐）+歌单批量下载MP3方法（某易云）

Python爬虫实战：多线程爬取配乐网，实现异步下载

FL Studio24.1.1.4239官方中文破解版下载安装使用指南

【Python爬虫】爬取网易云音乐，打造音乐下载器

Python爬虫——利用新浪微盘下载周杰伦的歌曲（共190首）

跟《经济学人》学英文：2024年6月29日这期 A new lab and a new paper reignite an old AI debate

跟《经济学人》学英文：2024年08月03日这期 Vienna’s social housing, lauded by progressives, pushes out the poor

用英文介绍伦敦：London The Empire MEGACITY

Bit manupulation in JS英文

ArcMap拓扑检查缝隙，使用Eliminate批量处理消除，就近合并属性

Windows系统批量禁用Defender杀毒软件

从60%到11%‼️中文同义句在线转换器

Linux常用命令英文全称与中文解释 (pwd、su、df、du等)

mac免费CAD模型设计软件FreeCAD怎样设置中文模式

WIN7中文专业版安装英文语言包的方法

win7系统DOS不显示中文或乱码

学Python爬虫，不看看m3u8文件如何加密？i春秋 m3u8 文件加密解析

ghost网络克隆功能实现【批量】计算机操作【系统的安装】,网络学习（三十）通过ghost的网络克隆功能实现操作系统的分发...

iMazing 3.0.3.1Mac中文破解版下载安装激活

FL Studio24.1.1.4285最新中文破解版下载 2024年最新附带补丁器激活码

发表评论

推荐文章

Windows&amp;Linux打CTFAWD常用命令

Python面试题

怎么加密文件夹？文件夹加密注意事项

SpringBoot 配置文件加密的两种方式

Oculus Interaction SDK

热门文章

计算机如何输入ip地址,电脑如何切换ip地址_怎么让电脑切换ip地址-win7之家

8万字带你入门Rust

【前端】【JavaScript】基础知识

【Parallel Programming】C++并发编程学习笔记ing（二）| condition_variable | async | future

windows和android双系统平板,平板电脑双系统和安卓单系统,哪个好用?

移动硬盘不小心制作成启动盘怎么办？别慌，这样解决更轻松

u盘作为启动盘，但是容量变成只有几兆

AI大模型的制造业场景，一文读懂

[踩坑记] CUDA环境下bitsandbytes安装报错异常解决

迅捷音频转换器如何提取音频文件教程

最新文章

Java开发工具：IDEA 2023.3(Win&amp;Mac)中文激活版

三分钟教会你FL Studio 21.3中文破解版图文激活教程

catiawin10许可证灰色_安装CATIA V5 6R2017 Win64时“许可证管理工具”窗口不弹出解决方案...

iMazing 3.0.3.1Mac中文破解版下载安装激活

Guitar Pro 8.2.1 Build 32中文解锁版+Soundbanks WinMac音色库 开心激活版

win10 下的anaconda + pytroch深度学习环境配置

WIN10系统下在ANACONDA中激活PYTHON及安装AUTOKERAS的步骤

FL Studio24.1.1.4285最新中文破解版下载 2024年最新附带补丁器激活码

Camtasia2024破解版注册码激活秘钥

Coreldraw2024永久免费破解版安装包下载附带激活码序列号

win10 下 EditPlus5.5 安装和使用记录

mathtype永久破解版2024最新安装教程中文版

原型设计工具：Axure RP9 中文激活版 winmac

EasyRecovery17中文破解版本安装包下载 附带注册码激活码

FL Studio 24.1.1.4239中文破解版的安装激活详细教程

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

Windows&Linux打CTFAWD常用命令

Java开发工具：IDEA 2023.3(Win&Mac)中文激活版

Guitar Pro 8.2.1 Build 32中文解锁版+Soundbanks WinMac音色库开心激活版

EasyRecovery17中文破解版本安装包下载附带注册码激活码

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载