信息"/>
[使用node.js在pdf中获取特定信息
[大规模地,我试图从api获取大量合同,这些合同包含pdf文件,其中包含合同的详细信息。提取这些文件后,我正在使用“ pdf-parse”()node.js库读取pdf的文本。
现在我的问题是:我如何设法从那些文件中读取某些值?例如,在pdf的开头,应该有合同双方的简介。我想获取签名方的名称和电子邮件,其格式如下,几乎在pdf的开头。属性名称为偶数,并且信息以偶数点开头。
Name Mark Jackson
Address Winston Street 13
Email Mark@[email protected]
Etc... ABCD...
什么样的方法会让我得到这些,并且只有合同的这些属性?
回答如下:a = `Name Mark Jackson
Address Winston Street 13
Email Mark@[email protected]
Etc... ABCD...
`;
您可以像这样轻松地提取您的姓名和电子邮件:
const name = a.match(/Name\s+(.*?)\n/, 'm')[1].trim();
const email = a.match(/Email\s+(.*?)\n/, 'm')[1].trim();
更多推荐
[使用node.js在pdf中获取特定信息
发布评论