java代码实现PDF转DOC文档|电子爱好者

admin管理员组
文章数量:1605317

文章目录

前言
一、快速无格式版本
二、保留格式转换

前言

每次遇到PDF文件时，总有把它转为Word文档的冲动，也时常会有这种转换的必要。通常的做法可能会是去开个PDF编辑器的会员啥的，某次突然觉得作为程序员为何不自己写段代码来实现PDF——>word的转换呢?当然自己写这个代码未免也是太过草率，遍寻网上众多方式，也算是有所收获，以下版本亦是借鉴一些大师的写法。

一、快速无格式版本

转换速度快，转换后的文档无PDF中的格式和图片，某些文档会出错（**暂未深究具体影响因素** ）。

代码示例

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;

import java.io.*;
public class PdfAndWordByNoImage {
    public static void pdfToWord(String pdfInputFile) throws Exception {
        System.out.println("转换开始......");
        long startTime = System.currentTimeMillis();
        PDDocument doc = PDDocument.load(new File(pdfInputFile));
        int pagenumber = doc.getNumberOfPages();//获取总页数
        System.out.println("获取总页数："+pagenumber);
        FileOutputStream fos = null;
        try {
            fos = new FileOutputStream(pdfInputFile.substring(0, pdfInputFile.indexOf(".")) + ".doc");
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        }
        Writer writer = null;
        try {
            writer = new OutputStreamWriter(fos, "UTF-8");//文件按字节读取，然后按照UTF-8的格式编码显示
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
        PDFTextStripper stripper = new PDFTextStripper();//生成PDF文档内容剥离器
        stripper.setSortByPosition(true);//排序
        stripper.setStartPage(1);//设置转换的开始页
        stripper.setEndPage(pagenumber);//设置转换的结束页
        try {
            stripper.writeText(doc, writer);
            writer.close();
            doc.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
        System.out.println("执行完毕,耗时："+(System.currentTimeMillis()-startTime)+"ms,......");
    }

    public static void main(String[] args) throws Exception {
        String pdfInputFile = "F:\\workSpace\\数据不说谎：大数据的世界.pdf";
        pdfToWord(pdfInputFile);
    }

依赖包：

<dependency>
            <groupId>commons-logging</groupId>
            <artifactId>commons-logging</artifactId>
            <version>1.2</version>
            <type>pom</type>
        </dependency>
        <dependency>
            <groupId>org.apache.pdfbox</groupId>
            <artifactId>pdfbox</artifactId>
            <version>2.0.11</version>
        </dependency>
        <dependency>
            <groupId>org.apache.pdfbox</groupId>
            <artifactId>jbig2-imageio</artifactId>
            <version>3.0.1</version>
        </dependency>
        <dependency>
            <groupId>org.apache.pdfbox</groupId>
            <artifactId>pdfbox-tools</artifactId>
            <version>2.0.11</version>
        </dependency>
        <dependency>
            <groupId>org.apache.pdfbox</groupId>
            <artifactId>fontbox</artifactId>
            <version>2.0.11</version>
        </dependency>

二、保留格式转换

可基本保留原格式及图片输出，转换速度有点慢。

代码示例

import com.spire.pdf.FileFormat;
import com.spire.pdf.PdfDocument;
public class PdfToWordByHaveImage {
    public static void pdfTodoc(String fileInputPath,String fileOutPutPath){
        PdfDocument pdf = new PdfDocument();
        System.out.println("开始加载PDF文件...");
        long startTime = System.currentTimeMillis();
        pdf.loadFromFile(fileInputPath);
        long endTime1 = System.currentTimeMillis();
        // 保存为Word格式
        Long diff = endTime1-startTime;
        System.out.println("文件加载完毕，耗时："+String.format("%.4f",diff.doubleValue()/1000)+"s，开始执行转换...");
        pdf.saveToFile(fileOutPutPath,FileFormat.DOCX);
        long endTime2 = System.currentTimeMillis();
        Long diff2 = endTime2-endTime1;
        System.out.println("文件转换完毕，耗时："+String.format("%.4f",diff2.doubleValue()/1000)+"s，...");
    }

    public static void main(String[] args) {
        String fileInputPath = "F:\\workSpace\\移动金融.pdf";
        String fileOutPutPath = "F:\\workSpace\\移动金融.doc";
        pdfTodoc(fileInputPath,fileOutPutPath);
        System.out.println("ok");
    }
}

依赖jar包
spire.pdf-3.7.4.jar

温馨提示：以上内容仅供参考，如有问题，请多指正！

.
学习无极限，不负时光，未来可期！

本文标签：代码文档 Java DOC PDF

版权声明：本文标题：java代码实现PDF转DOC文档内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1728480982a1160100.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

转换word为pdf，并且带有单独目录书签

2小时前

转换word为pdf，并且带有单独目录书签如果没有设置，转换word为pdf后，pdf文件有一个内嵌的目录，没有单独的书签读者可以通过这个目录

java word 转pdf or 直接生成pdf文件

2小时前

1、需要引入的maven坐标 <dependency><groupId>com.it

使用 pandoc 进行文档转换（markdown转word）

2小时前

pandoc 是一个神奇的转换工具（详见官网），它支持各种文档格式之间的转换。本文针对如何使用 pandoc 转换 markdown 为 docx 进行说明。 pandoc

java linux word转pdf

2小时前

网上搜索到的方式有很多，要么收费，要么失真，本文是推荐的免费，且还原度比较高，亲测可用，转换主要是通过给linux 服务器安装 libreoffice 服务实现的，作者用的版本是7.5.8，采用yum在线安装的是 5.6.30 版本测试

Word转Pdf(三行代码搞定)

2小时前

其实真的很简单，今天突然小伙伴向我抱怨word转pdf超过一页要收费，问我怎么办？收费，不可能的。loading.....OK! 第一步找jar包&am

vue项目保存页面为pdf 、word

2小时前

vue项目保存页面为pdf 、word pdf下载下载依赖 npm install html2canvasnpm install jspdf公用方法导出页面为PDF格式import html2Canvas from &q

java代码实现PDF转DOC文档

2小时前

文章目录前言一、快速无格式版本二、保留格式转换前言每次遇到PDF文件时，总有把它转为Word文档的冲动，也时常会有这种转换的必要。通常的做法可能会是去开个PDF编辑器的会员啥的&#

小程序,uniapp 实现excel,pdf,word导出并分享

2小时前

当代码执行结束后将会打开下载已完成的文件 excel() {const downloadTaskuni.downloadFile({url: https:kaima.site:9988uploads-malluploads1

java实现pdf转为word

2小时前

Installing Spire.Pdf.jar 如果您创建了⼀个 Maven 项⽬，您可以使⽤以下配置轻松地在您的应⽤程序中导⼊ jar。对于⾮ Maven 项⽬，请从此下载 jar ⽂件并⼿动

基于Python+Django框架word和pdf文档格式转换系统设计与实现

2小时前

博主介绍：黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者，CSDN博客专家，在线教育专家，CSDN钻石讲师&#xff

4、【办公自动化】Python实现Word转PDF

2小时前

在日常办公过程中，总是离不开和文档打交道，有一个最常用的场景就是把 Word 文档转成 PDF 格式。PDF 文档的优势在于：在不同编辑器或不同设备上，

通过java实现word转PDF

2小时前

介绍用于java项目中解决word转pdf的需求，转换的效果跟调用的工具类、字体库、源文件（是wps还是microsoft保存的，格式版本等）、系统

java使用Aspose实现 word文档转pdf文件高效不失真

2小时前

java使用Aspose word文档转pdf功能实现主要步骤使用Aspose进行文档转换，首先引入相应的jar包到系统环境项目resource下导入license.xml文件使用Aspose时&#xf

python实现批量word转pdf

2小时前

之前用win32com模块转pdf，安装模块的过程中不太顺利，后面发现有docx2pdf模块，直接可以安装使用。 #在运行的过程中不能打开word文档&#xff0c

java html转word、pdf(包含图片)

2小时前

html转word maven依赖 <dependency><groupId>org.apache.poi<groupId><artifactId>poi<artifactId>

SpringBoot使用LibreOffice word转换PDF

2小时前

由于java转pdf Aspose需要收费，documents4j是使用本地的MS Office应用做的文件格式转换，Linux没有对应的MS Office应用。这样造成了我们需要选用别的方式进行

关于java中实现word转pdf

2小时前

1.java中实现word转pdf几种方式如下 1.使用jacob（Java COM Bridge）操作offfice的方式，基于这种方式无论是水印还是格式都可以完美转换；但是这个方式都只是基于windos下，但有些项目是需要部署到lin

Java使用Spire.Pdf或Aspose-Words实现Word转换Pdf在Linux服务器上的中文乱码问题

2小时前

一、问题产生的背景当Word文档中含有中文字符时，不管是使用Spire.Pdf或Aspose-Words实现Word转换Pdf，代码的执行都需要调用操作系统的本地字体库支持&#xff0

java使用poi-tl导出word及转换PDF后的合并导出pdf

2小时前

1、背景为某单位开发的一款项目申报审批系统，用户需求在申报阶段填写的信息资料能够导出PDF。且项目申报的报告正文为用户上传，所以需要合并导出。 2、问题在项目初期阶段使用的是PDF的预设

java判断硬盘为固态硬盘_如何查看或判断磁盘硬盘是固态硬盘（SSD）还是机械硬盘（HDD）...

23分钟前

想要判断 Linux 下磁盘是固态硬盘(solid-state drive)还是机械硬盘(hard disk)，有多种方法。方法一，cat sysblock{fs_name}queue

电子爱好者 - 最新技术资讯及电子产品介绍！

java代码实现PDF转DOC文档

文章目录

前言

一、快速无格式版本

二、保留格式转换

更多相关文章

转换word为pdf，并且带有单独目录书签

java word 转pdf or 直接生成pdf文件

使用 pandoc 进行文档转换（markdown转word）

java linux word转pdf

Word转Pdf(三行代码搞定)

vue项目保存页面为pdf 、word

java代码实现PDF转DOC文档

小程序,uniapp 实现excel,pdf,word导出并分享

java实现pdf转为word

基于Python+Django框架word和pdf文档格式转换系统设计与实现

4、【办公自动化】Python实现Word转PDF

通过java实现word转PDF

java使用Aspose实现 word文档转pdf文件高效不失真

python实现批量word转pdf

java html转word、pdf(包含图片)

SpringBoot使用LibreOffice word转换PDF

关于java中实现word转pdf

Java使用Spire.Pdf或Aspose-Words实现Word转换Pdf在Linux服务器上的中文乱码问题

java使用poi-tl导出word及转换PDF后的合并导出pdf

java判断硬盘为固态硬盘_如何查看或判断磁盘硬盘是固态硬盘（SSD）还是机械硬盘（HDD）...

发表评论

推荐文章

windowsServer2012搭建服务器容器(Apache+php+Mysql)

基于C++代码的UE4学习（三十）——蓝图的Construction Script与TIMER结合的控制Cube显现

笔记本电脑突然无法链接wifi、无法连接宽带

Java JDK 1.6官方下载(jdk6.0) Win-32位官方正式版下载--Java免费学习网

安徽大学软件工程考研历程

热门文章

vps、云服务器、虚拟主机

实战|两种常用的跨主机Docker容器互通方法

记录：激活office失败，报错码:0x80080005

解决电脑没声音问题

java会导致蓝屏么_原来有这么多原因会导致电脑蓝屏啊

Keil5 5.38官方下载、安装教程 ——2024年9月25日

推荐几款免费的杀毒软件

高性能计算机与网格的研究开发态势

AUTOCAD——超级填充命令3

常用软件官网下载大总结

最新文章

计算机浏览器中默认存在的安全协议是什么,计算机浏览器中默认存在的安全协议是( )。...

.NET开发十大常用工具软件分享

Charles常用的十大功能

Node-RED 物联网应用开发的十大特性有哪些？

淘客十大常用网站，成为大牛的起点

Java十大常用框架介绍(spring系+dubbo+RabbitMQ+Ehcache+redis)

CSS常用十大技巧

Node-RED 物联网应用开发：十大特性

Webpack十大高频考点深入解析

Java十大常用框架介绍

〖程序员的自我修养 - 认知剖析篇③〗- 十大编程语言的优缺点

【简单工具】SQLMap十大常用功能浅析（待完善）

史上最全的常用开发工具类收集（持续更新中）

常用的十大Python开发工具

这些插件太强了，Chrome 必装！尤其程序员！

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载