admin管理员组文章数量:1584462
导入依赖:
Apache PDFBox提供了处理PDF文档的功能。
Apache POI支持处理Word、Excel和.ppt。
<dependencies>
<!-- Apache PDFBox -->
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>pdfbox</artifactId>
<version>2.0.27</version>
</dependency>
<!-- Apache POI -->
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>5.0.0</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>5.0.0</version>
</dependency>
</dependencies>
代码实现:
import org.apache.poi.xwpf.usermodel.*;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
public class PdfToWordConverter {
public static void convertPdfToWord(String pdfFilePath, String docxFilePath) {
try {
// 加载PDF文档
PDDocument document = PDDocument.load(new FileInputStream(pdfFilePath));
// 创建Word文档
XWPFDocument doc = new XWPFDocument();
// 提取PDF文本内容
PDFTextStripper stripper = new PDFTextStripper();
String text = stripper.getText(document);
// 创建段落并添加文本内容
XWPFParagraph paragraph = doc.createParagraph();
XWPFRun run = paragraph.createRun();
run.setText(text);
// 保存Word文档
FileOutputStream out = new FileOutputStream(docxFilePath);
doc.write(out);
out.close();
// 关闭文档
document.close();
doc.close();
System.out.println("PDF转Word成功!");
} catch (IOException e) {
System.out.println("PDF转Word失败:" + e.getMessage());
}
}
// 在main方法中调用convertPdfToWord方法,传入PDF文件的路径和要生成的Word文档的路径
public static void main(String[] args) {
String pdfFilePath = "input.pdf";
String docxFilePath = "output.docx";
convertPdfToWord(pdfFilePath, docxFilePath);
}
}
版权声明:本文标题:JAVA实现将PDF转换成word文档 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.elefans.com/xitong/1727941785a1139040.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论