【python】pdf转png；pdf转word|电子爱好者

admin管理员组
文章数量:1605148

1 pdf转png

需要提前安装的包 pip install pymupdf
创建一个文件夹，把需要转换的pdf图片全部放入该文件夹，在文件夹中新建一个py文件，拷入代码：

import os
import fitz

pdf_dir=[]

def get_file():
    docunames = os.listdir()
    for docuname in docunames:
        if os.path.splitext(docuname)[1] == '.pdf':#目录下包含.pdf的文件
            pdf_dir.append(docuname)
            
def conver_img():
    for pdf in pdf_dir:
        doc = fitz.open(pdf)
        pdf_name = os.path.splitext(pdf)[0]
        for pg in range(doc.pageCount):
            page = doc[pg]
            rotate = int(0)
            # 每个尺寸的缩放系数为2，这将为我们生成分辨率提高四倍的图像。
            zoom_x = 2.0
            zoom_y = 2.0
            trans = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)
            pm = page.getPixmap(matrix=trans, alpha=False)
            pm.writePNG('%s.png' % pdf_name)
            
if __name__ == '__main__':
    get_file()
    conver_img()

参考：
https://wwwblogs/ken-yu/p/12401923.html

2 pdf转word

可将PDF转换成docx文件的Python库。该项目通过PyMuPDF库提取PDF文件中的数据，然后采用python-docx库解析内容的布局、段落、图片、表格等，最后自动生成docx文件。

pdf2docx功能

解析和创建页面布局
页边距 - 章节和分栏 (目前最多支持两栏布局) - 页眉和页脚 [TODO]- 解析和创建段落 - OCR 文本 [TODO] - 水平（从左到右）或竖直（自底向上）方向文本 - 字体样式例如字体、字号、粗/斜体、颜色 - 文本样式例如高亮、下划线和删除线 - 列表样式 [TODO] - 外部超链接 - 段落水平对齐方式 (左/右/居中/分散对齐)及前后间距- 解析和创建图片 - 内联图片 - 灰度/RGB/CMYK等颜色空间图片 - 带有透明通道图片 - 浮动图片（衬于文字下方）- 解析和创建表格 - 边框样式例如宽度和颜色 - 单元格背景色 - 合并单元格 - 单元格垂直文本 - 隐藏部分边框线的表格 - 嵌套表格- 支持多进程转换
pdf2docx同时解析出了表格内容和样式，因此也可以作为一个表格内容提取工具。

限制

目前暂不支持扫描PDF文字识别
仅支持从左向右书写的语言（因此不支持阿拉伯语）- 不支持旋转的文字- 基于规则的解析无法保证100%还原PDF样式

安装
pip install pdf2docx

案例

from pdf2docx import parse

pdf_file = './第五章_副本.pdf' # pdf所在目录
docx_file = './第五章_副本.docx' # 生成的 word 文件放在哪儿
docxparse(pdf_file, docx_file)

运行结果，看，是不是还算不错：

本文标签： PDF Python word PNG

版权声明：本文标题：【python】pdf转png；pdf转word 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1728479317a1159950.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

Aspose工具实现word和ppt转pdf功能及遇到的一些问题

1小时前

Aspose工具包从word和ppt转到pdf的实现过程直接放项目地址说一下实现过程中遇到的坑直接放项目地址 https:githublichangliu1098File2Pdf 说一下实现过程中遇到的坑 jar包的引入&a

SpringBoot word文件转pdf

1小时前

1 首先是引入 jar 包 jar 包资源在这里大家可以下载使用链接描述-这个是需要积分的大家可以回复小编发给大家 maven 中引用外包的jar包，在你的 pom 文件中加载 jar 内容 <depen

vue项目保存页面为pdf 、word

1小时前

vue项目保存页面为pdf 、word pdf下载下载依赖 npm install html2canvasnpm install jspdf公用方法导出页面为PDF格式import html2Canvas from &q

java生成word word转pdf 完美样式兼任

1小时前

1、完美样式的word，最优推荐是springframework(跨平台)2、完美样式的pdf,方案一：jacob.jar(试用Windows操作系统)；方案二：aspose.jar(跨平台；收费；试用版有水印，可破解)；方

java代码实现PDF转DOC文档

1小时前

文章目录前言一、快速无格式版本二、保留格式转换前言每次遇到PDF文件时，总有把它转为Word文档的冲动，也时常会有这种转换的必要。通常的做法可能会是去开个PDF编辑器的会员啥的&#

小程序,uniapp 实现excel,pdf,word导出并分享

1小时前

当代码执行结束后将会打开下载已完成的文件 excel() {const downloadTaskuni.downloadFile({url: https:kaima.site:9988uploads-malluploads1

js实现在线word文档转pdf工具

1小时前

作为一名开发者，我对于创造有用的工具和解决实际问题充满热情。最近，我开发了一个在线Word文档转PDF的工具，这给我带来了巨大的喜悦和成就感。在这篇文章中&#xff0

直接从pdf复制英文到word，英文字体格式调整方法

1小时前

文章目录前言一、字体间距问题二、英文数字或字母间距过大三、换行符过多四、图片显示不全前言在撰写学术论文时，本人经常从PDF格式的参考文献中复制文本并粘贴到Word文档。但文字在复制粘贴的过程中经常发生各种各样、

Word转PDF 并转成base64（亲测可用）

1小时前

Word转PDF 并转成base64（亲测可用） 摘要：控制台实现类POMGradle扩展其他方式 apose控制台实现类POMGradle扩展其他方式 apose 博主默

Java轻松转换Markdown文件到Word和PDF文档

1小时前

Markdown 凭借其简洁易用的特性，成为创建和编辑纯文本文档的常用选择。但某些时候我们需要更加精致的展示效果，例如在专业分享文档或打印成离线使用的纸质版时，就需要将Mar

JAVA 使用aspose把word转pdf

1小时前

文章目录一、下载并引入jar(一般的库里面没有)二、使用步骤1.在resources下新增文件夹lib,将上面下载的两个jar存入2.POM引入3.添加授权文件，在resources下新建文件license.xml4

通过java实现word转PDF

1小时前

介绍用于java项目中解决word转pdf的需求，转换的效果跟调用的工具类、字体库、源文件（是wps还是microsoft保存的，格式版本等）、系统

PDF转Word神器—ABBYY FineReader，这个必须有！（图文）

1小时前

有时需要将PDF转成Word，这个功能对于写材料的人用的会很多，怎么才能快速把pdf里的文字导出来变成word呢？以前也下载过几个这样的软件，无奈都是转

MATLAB 文件处理的一种方式，如pdf、word、excel等

1小时前

通过创建vbs文件，然后结合vbs来对文件进行操作 VBS是基于Visual Basic的脚本语言。VBS的全称是：Microsoft Visual Basic Script Edition。&a

PDF文档免费转成Word文档，不限页数。

1小时前

链接1：https:download.csdndownloadAuspicious_air18661582 链接2：https:download.csdndownloadAus

关于java中实现word转pdf

1小时前

1.java中实现word转pdf几种方式如下 1.使用jacob（Java COM Bridge）操作offfice的方式，基于这种方式无论是水印还是格式都可以完美转换；但是这个方式都只是基于windos下，但有些项目是需要部署到lin

libreoffice实现word,excel等转换成pdf

1小时前

1、准备工作环境：centos7libreoffice版本：LibreOffice_5.4.6 2、安装过程用远程连接工具将下载的LibreOffice_5.4.6.gz发送到服

markdown转word （vscode插件+wps法）

1小时前

1.用vscode下载一个markdown转换的插件，我用的：Markdown PDF 2.vscode打开markdown文件，然后在文件页面右键，将

itext word怎么转成pdf

1小时前

import java.io.File;import java.io.FileInputStream;import java.io.FileOutputStream;import java.util.Iterator;import java

Java实现Word转PDF【完整版】

1小时前

前言： 最近也是在非常紧急的准备暑期实习的面试，一边学习一边修补简历，因为之前看到某位大佬的帖子说建议投递的简历形式为PDF，这一下可是把我难死了&a

电子爱好者 - 最新技术资讯及电子产品介绍！

【python】pdf转png；pdf转word

1 pdf转png

2 pdf转word

更多相关文章

Aspose工具实现word和ppt转pdf功能及遇到的一些问题

SpringBoot word文件转pdf

vue项目保存页面为pdf 、word

java生成word word转pdf 完美样式兼任

java代码实现PDF转DOC文档

小程序,uniapp 实现excel,pdf,word导出并分享

js实现在线word文档转pdf工具

直接从pdf复制英文到word，英文字体格式调整方法

Word转PDF 并转成base64（亲测可用）

Java轻松转换Markdown文件到Word和PDF文档

JAVA 使用aspose把word转pdf

通过java实现word转PDF

PDF转Word神器—ABBYY FineReader，这个必须有！（图文）

MATLAB 文件处理的一种方式，如pdf、word、excel等

PDF文档免费转成Word文档，不限页数。

关于java中实现word转pdf

libreoffice实现word,excel等转换成pdf

markdown转word （vscode插件+wps法）

itext word怎么转成pdf

Java实现Word转PDF【完整版】

发表评论

推荐文章

linux下载minio

【为什么电脑插上HDMI线之后，电脑没有了声音解决方案】

十大Wifi芯片原厂

【面试高频】Java设计原则总结

【mfxp】关于播放器插件损坏的解决方案

热门文章

GitHub官方App正式推出了，小伙伴们确定不下载一个吗？

移动硬盘0字节，数据恢复有妙招

宽带路由器性能评判常见六大误区

AXI总线技术简介——ZYNQ PS和PL的互联技术

[vmware]解析单一GHO文件如何安装操作系统

vm15虚拟机没声音常见解决方法与设置了声卡也没声音

版本扫盲及最新android studio下载

Keil5 5.38官方下载、安装教程 ——2024年9月25日

Windows Server 2012：安装IIS、FTP服务

unity 游戏上架Google Play

最新文章

php音乐播放器带进度条的,Flex播放器(实现播放、缓冲进度条和音频曲线显示)

Adobe Director MX 2004：多媒体创作与互动设计

苹果cms（maccms） player播放器解密

XPlayer 开源视频播放器教程

痞子衡嵌入式：基于恩智浦i.MXRT1060的MP4视频播放器(RT-Mp4Player)设计

ZArchiver Pro、MX Player Pro两款专业应用让你的手机更专业

Android os 4.4.4 魅族,魅族Mx3刷机包 Android 4.4.4 稳定版Flyme OS 3.7.3A 流畅顺滑体验

【正点原子Linux连载】第十三章 多媒体 摘自【正点原子】I.MX6U嵌入式Qt开发指南V1.0.2

YUV视频格式到RGB32格式转换的速度优化 上篇

FX Player PRO v3.7.8视频播放器高级多语言版支持8K

IMX6ULL-QT项目之mplayer音乐播放器-交叉编译mplayer

【计算机毕设文章】音乐播放器管理系统

Android病毒家族及行为（一）

Socket接收的视频流怎样保存和播放

Android平台mass storage相关代码

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

【正点原子Linux连载】第十三章多媒体摘自【正点原子】I.MX6U嵌入式Qt开发指南V1.0.2

YUV视频格式到RGB32格式转换的速度优化上篇

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载