[使用node.js在pdf中获取特定信息

编程入门 行业动态 更新时间:2024-10-07 18:26:36

[使用node.js在pdf中获取特定<a href=https://www.elefans.com/category/jswz/34/1770440.html style=信息"/>

[使用node.js在pdf中获取特定信息

[大规模地,我试图从api获取大量合同,这些合同包含pdf文件,其中包含合同的详细信息。提取这些文件后,我正在使用“ pdf-parse”()node.js库读取pdf的文本。

现在我的问题是:我如何设法从那些文件中读取某些值?例如,在pdf的开头,应该有合同双方的简介。我想获取签名方的名称和电子邮件,其格式如下,几乎在pdf的开头。属性名称为偶数,并且信息以偶数点开头。

Name          Mark Jackson 
Address       Winston Street 13 
Email         Mark@[email protected] 
Etc...        ABCD...

什么样的方法会让我得到这些,并且只有合同的这些属性?

回答如下:a = `Name Mark Jackson Address Winston Street 13 Email Mark@[email protected] Etc... ABCD... `;

您可以像这样轻松地提取您的姓名和电子邮件:

const name = a.match(/Name\s+(.*?)\n/, 'm')[1].trim();
const email = a.match(/Email\s+(.*?)\n/, 'm')[1].trim();

更多推荐

[使用node.js在pdf中获取特定信息

本文发布于:2024-05-07 14:03:02,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1756585.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:信息   node   js   pdf

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!