admin管理员组

文章数量:1593159

60行Python代码,实现多线程PDF转Word

分解任务

把PDF转为Word,分几步?两步,第一步读取PDF文件,第二步写入Word文件。

是的,就是这么简单,借助Python第三方包,可以轻松实现上面两个过程,我们要用到pdfminer3k和python-docx这两个包

读取PDF

from pdfminer.pdfinterp import PDFResourceManager

from pdfminer.pdfinterp import process_pdf

from pdfminer.converter import TextConverter

from pdfminer.layout import LAParams

resource_manager = PDFResourceManager()

return_str = StringIO()

lap_params = LAParams()

device = TextConverter(resource_manager, return_str, laparams=lap_params)

process_pdf(res

本文标签: 转化为轻松wordPDFPython