Java中PDF转WORD|电子爱好者

admin管理员组
文章数量:1605193

之前在逛网站时看到一个需求：实现将PDF中文字，图片，样式等转成word，xls，html等多种格式。
于是便尝试做了一下，总结如下（只有最下面的能实现，其他都只是我的总结）：

package com.lin.test;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;

import java.io.*;

public class PdfToWord {

    public static void main(String[] args) {
        try {
            String pdfFile = "C:\\Users\\a\\Desktop\\滴滴出行行程报销单.pdf";
            PDDocument doc = PDDocument.load(new File(pdfFile));
            // 获取PDF页数
            int pageNumber = doc.getNumberOfPages();
            String pfdName = pdfFile.substring(0, pdfFile.lastIndexOf(".")) + ".doc";

            FileOutputStream fos = new FileOutputStream(pfdName);
            Writer writer = new OutputStreamWriter(fos, "utf-8");

            // PDF文本剥离器
            PDFTextStripper stripper = new PDFTextStripper();
            stripper.setSortByPosition(true);
            stripper.setStartPage(1);
            stripper.setEndPage(pageNumber);
            stripper.writeText(doc,writer);

            writer.close();
            doc.close();
            System.out.println("PDF转换WORD成功");
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

在开始时我是使用PDFTextStrippe转换格式，但发现这方法 只能转纯文本，图片和格式这些都是没有。。 毕竟名字已经写得很清楚了TextStrippe（文本剥离）

下面方法是 导出PDF内部图片

package com.lin.test;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
import org.apache.pdfbox.pdmodel.PDResources;
import org.apache.pdfbox.pdmodel.graphics.xobject.PDXObjectImage;

import java.io.File;
import java.io.IOException;
import java.util.List;
import java.util.Map;
import java.util.Set;

public class PdfToWord {

    public static void main(String[] args) {
        try {
            String pdfFile = "C:\\Users\\a\\Desktop\\滴滴出行行程报销单.pdf";
            PDDocument doc = PDDocument.load(new File(pdfFile));

            List<PDPage> pages = doc.getDocumentCatalog().getAllPages();
            int count = 0;
            for (PDPage page : pages) {
                PDResources resources = page.getResources();
                Map<String, PDXObjectImage> images = resources.getImages();
                if (images != null) {
                    Set<String> imageNames = images.keySet();
                    for (String imageName : imageNames) {
                        count++;
                        PDXObjectImage image = images.get(imageName);
                        String name = imageName + "_" + count;
                        image.write2file("C:\\Users\\a\\Desktop\\test\\" + name);
                    }
                }
            }
            doc.close();
            System.out.println("PDF导出内部图片成功");
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

}

然后我便想将PDF中的图片全部导出来，然后再放到word中，但是这样的话文字和图片是没有办法对上，而且格式还是没有。。。

最后在网上瞎逛了，发现实现方法其实很简单的，只需要引入spire.pdf包就可以，转换方法几乎都在里面有：

package com.lin.test;

import com.spire.pdf.FileFormat;
import com.spire.pdf.PdfDocument;

public class Pdf4 {
    public static void main(String[] args) {
        try {
            // PDF文件
            String pdfFile = "C:\\Users\\a\\Desktop\\滴滴出行行程报销单.pdf";
            PdfDocument pdf = new PdfDocument(pdfFile);
            // DOC文件
            String pfdName = pdfFile.substring(0, pdfFile.lastIndexOf(".")) + ".doc";
            pdf.saveToFile(pfdName, FileFormat.DOC);
            System.out.println("PDF导出内部图片成功");
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

我这里直接简单转换格式而已，详细可以参考E-iceblue官网的帮助文档，里面有更多方法。。。

本文标签： Java PDF word

版权声明：本文标题：Java中PDF转WORD 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1728478661a1159884.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

pdf提取矢量图，插入visio 或者 word中，保持矢量图特性；编辑pdf图片

1小时前

自己用的WPS中的pdf，干啥都要会员，连剪裁图片并提取都做不到。。。。现在附一份免费攻略，让大家少走弯路。 （1）从对应的PDF

pdf转word免费

1小时前

终于找到一个pdf免费转word的工具没有5页限制，没有大小限制。保存记录下。 http:pdf2docx

Latex转换成word

1小时前

Latex转换成word https:www.zhihuquestion31850346 https:tex.stackexchangequestions4145workflow-for-converting-late

java实现pdf转为word

1小时前

Installing Spire.Pdf.jar 如果您创建了⼀个 Maven 项⽬，您可以使⽤以下配置轻松地在您的应⽤程序中导⼊ jar。对于⾮ Maven 项⽬，请从此下载 jar ⽂件并⼿动

直接从pdf复制英文到word，英文字体格式调整方法

1小时前

文章目录前言一、字体间距问题二、英文数字或字母间距过大三、换行符过多四、图片显示不全前言在撰写学术论文时，本人经常从PDF格式的参考文献中复制文本并粘贴到Word文档。但文字在复制粘贴的过程中经常发生各种各样、

使用aspose-words完成word和PDF、HTML之间的相互转换

1小时前

实现word和PDF、HTML之间的相互转换使用aspose-words完成因为工作需要把word转为PDF实现在线预览、word的内容放到富文本编辑器实现在线编辑、支持富文本内容在线导出为word文档等，就需要把

使用简短代码便可实现word批量转pdf

1小时前

本方法可在系统文件夹中，将文件夹里的word文档批量转换成pdf格式，且无需借助工具。代码如下： Convert .doc or .docx to .pdf files

Linux(CentOS)下使用unoconv转换word到pdf

1小时前

首先安装libreoffice yum install -y libreoffice.x86_64 下载或者克隆unoconv wget https:githubunoconvunoconvarchivemaster.zip

4、【办公自动化】Python实现Word转PDF

1小时前

在日常办公过程中，总是离不开和文档打交道，有一个最常用的场景就是把 Word 文档转成 PDF 格式。PDF 文档的优势在于：在不同编辑器或不同设备上，

JAVA 使用aspose把word转pdf

1小时前

文章目录一、下载并引入jar(一般的库里面没有)二、使用步骤1.在resources下新增文件夹lib,将上面下载的两个jar存入2.POM引入3.添加授权文件，在resources下新建文件license.xml4

使用poi+itextpdf将word转成pdf

1小时前

将word转换成pdf确实有很多种方案！ 背景最近正好需要做一个这样的功能，需求是将word模板进行签名后转换为pdf。为此，我花了一点时间去网上找方案。期间遇到了一些

Spring Boot写一个简单的PDF到Word的转换程序

1小时前

使用Spring Boot创建PDF到Word的转换程序需要几个步骤。可以使用现有的库来处理转换过程。使用ApachePDFBox进行PDF操作和使用ApachePOI创建Word文档的过程。添加依赖项: 将以下依赖项添加到“pom.xm

SpringBoot实现Excel、Word转换为PDF

1小时前

😊作者： 一恍过去 💖主页： https:blog.csdnzhuocailing3390 🎊社区&

python实现批量word转pdf

1小时前

之前用win32com模块转pdf，安装模块的过程中不太顺利，后面发现有docx2pdf模块，直接可以安装使用。 #在运行的过程中不能打开word文档&#xff0c

Java通过openOffice实现word,excel，ppt转成pdf实现在线预览

1小时前

Java通过openOffice实现word,excel，ppt转成pdf实现在线预览一、OpenOffice1.1 下载地址1.2 JodConverter1.3 新建实体类PDFDemo 二、实践代码二三、lin

关于java中实现word转pdf

1小时前

1.java中实现word转pdf几种方式如下 1.使用jacob（Java COM Bridge）操作offfice的方式，基于这种方式无论是水印还是格式都可以完美转换；但是这个方式都只是基于windos下，但有些项目是需要部署到lin

itext word怎么转成pdf

1小时前

import java.io.File;import java.io.FileInputStream;import java.io.FileOutputStream;import java.util.Iterator;import java

Java使用Spire.Pdf或Aspose-Words实现Word转换Pdf在Linux服务器上的中文乱码问题

1小时前

一、问题产生的背景当Word文档中含有中文字符时，不管是使用Spire.Pdf或Aspose-Words实现Word转换Pdf，代码的执行都需要调用操作系统的本地字体库支持&#xff0

Vue3 word如何转成pdf代码实现

1小时前

🙂博主：锅盖哒 🙂文章核心：word如何转换pdf 目录 1.前端部分 2.后端部分在Vue 3中，前端无法直接将Wo

Java代码实现word转PDF

1小时前

import com.spire.doc.Document; import com.spire.doc.FileFormat; import lombok.extern.slf4j.Slf4j; public class WordCon

电子爱好者 - 最新技术资讯及电子产品介绍！

Java中PDF转WORD

更多相关文章

pdf提取矢量图，插入visio 或者 word中，保持矢量图特性；编辑pdf图片

pdf转word免费

Latex转换成word

java实现pdf转为word

直接从pdf复制英文到word，英文字体格式调整方法

使用aspose-words完成word和PDF、HTML之间的相互转换

使用简短代码便可实现word批量转pdf

Linux(CentOS)下使用unoconv转换word到pdf

4、【办公自动化】Python实现Word转PDF

JAVA 使用aspose把word转pdf

使用poi+itextpdf将word转成pdf

Spring Boot写一个简单的PDF到Word的转换程序

SpringBoot实现Excel、Word转换为PDF

python实现批量word转pdf

Java通过openOffice实现word,excel，ppt转成pdf实现在线预览

关于java中实现word转pdf

itext word怎么转成pdf

Java使用Spire.Pdf或Aspose-Words实现Word转换Pdf在Linux服务器上的中文乱码问题

Vue3 word如何转成pdf代码实现

Java代码实现word转PDF

发表评论

推荐文章

PS动效插件imagemotion汉化版

k-Wave丨光声成像仿真丨基础篇：下载安装及简易操作（一）

【运维】自动化运维工具，使用 Ansible 进行开发环境配置管理（本地远程，brewscoopyum，dockerpackeropenstack）

陇剑杯-Misc-wifi

python苹果手机照片导入电脑_拯救你的16GB iPhone利用Seafile创建私有云将照片同步到PC上...

热门文章

cmd恢复硬盘误删数据

移动硬盘位置不可用的数据恢复方法

win10系统安装.net 3.5

Frp内网穿透保姆级教程 windows内网穿透

服务器远程桌面一直正在配置,win10系统无法远程一直显示“正在配置远程会话”的详细方法...

探索 EdXposedManager：Android 自定义化的强力助手

Linux常见指令&amp;基础知识

关于Windows和Linux的那些事儿

Ubuntu22.04软件安装笔记（双系统与WSL）

Recommended software

最新文章

Flash MX实战精选:音乐播放器

【正点原子Linux连载】第八章 文本读写摘自【正点原子】I.MX6U嵌入式Qt开发指南V1.0.2

1.基于S5PV210的图片解码播放器（详解）

魅族mx4pro输入法问题。

AV Linux MX-21 来了，多媒体创作者梦想成真

vue + element ui实现播放器功能

对 mp3 乱码问题的分析和解决(ZZ)

哪款播放器好

imx6ul移植madplay播放器

android的歌词播放,android手机音乐播放器实现歌词同步

【正点原子Linux连载】第二十三章 音频应用编程-摘自【正点原子】I.MX6U嵌入式Linux C应用编程指南V1.1

【正点原子Linux连载】第六十五章 Linux 音频驱动实验 -摘自【正点原子】I.MX6U嵌入式Linux驱动开发指南V1.0

android音乐播放器 单曲循环,[Android] MediaPlayer单曲循环不卡顿

播放器smplayer的各种键盘快捷键

android小窗口播放视频,[安卓] 支持投屏、电视台和小窗口的视频播放器：MoboPlayer...

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

Linux常见指令&基础知识

【正点原子Linux连载】第八章文本读写摘自【正点原子】I.MX6U嵌入式Qt开发指南V1.0.2

【正点原子Linux连载】第二十三章音频应用编程-摘自【正点原子】I.MX6U嵌入式Linux C应用编程指南V1.1

android音乐播放器单曲循环,[Android] MediaPlayer单曲循环不卡顿

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载