利用C#批量从pdf中提取图片和文字(亲身实践绝对有效)|电子爱好者

admin管理员组
文章数量:1567919

2023年12月23日发(作者：)

最近由于工作原因，需要从pdf中提取里面的图片和文字，网上这方面的资料很少，最后费了九牛二虎之力终于搞定了，用的编程语言是C#，用到的工具包是itextSharp,主要代码如下，希望有相同需求的朋友可以少走些弯路。

方法一：从pdf中提取图片

private void ExtractImage(string pdfFile)

{

PdfReader pdfReader = new PdfReader(pdfFile);

for (int pageNumber = 1; pageNumber <=

OfPages; pageNumber++)

{

PdfReader pdf = new PdfReader(pdfFile);

PdfDictionary pg = eN(pageNumber);

PdfDictionary res =

(PdfDictionary)Object((CES));

PdfDictionary xobj =

(PdfDictionary)Object((T));

try

{

foreach (PdfName name in )

{

PdfObject bj = (name);

if (rect())

{

PdfDictionary tg =

(PdfDictionary)Object(obj);

string width = ().ToString();

string height = ().ToString();

//ImageRenderInfo imgRI =

ForXObject((GraphicsState)new

Matrix((width), (height)), (PRIndirectReference)obj, tg);

ImageRenderInfo imgRI =

ForXObject(new GraphicsState(),

(PRIndirectReference)obj, tg);

RenderImage(imgRI);

}

}catch

{

continue;

}

方法二：将图片保存到文件

private void RenderImage(ImageRenderInfo renderInfo)

{

count++;

PdfImageObject image = ge();

using (Dotnet dotnetImg = wingImage())

{

if (dotnetImg != null)

{

using (MemoryStream ms = new MemoryStream())

{

(ms, );

Bitmap d = new Bitmap(dotnetImg);

(@"");

}

方法三：从pdf中提取文本

public void ExtractTextFromPDFPage(string pdfFile)

{

PdfReader reader = new PdfReader(pdfFile);

int n = OfPages;

for (int i = 1; i <= n; i++)

{

string text = tFromPage(reader, i);

}

try { (); }

catch { }

}

本文标签：图片提取文字用到需求

版权声明：本文标题：利用C#批量从pdf中提取图片和文字(亲身实践绝对有效) 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1703291753a48191.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

【PM】【需求】项目管理-需求：管理软件需求分析过程

4天前

文章概括为，纵向，横向，从面到点，最后是需求质量控制。软件的需求分析必须要有对原业务的一个深入了解、提取、抽象、升华的过程。软件的需求分析是从用户

WPS文字常用排版快捷键

4天前

【左对齐】左对齐快捷键为“CtrlL”组合键，按下组合键可快速调整选中文段对齐方式； 【右对齐】右对齐快捷键为“CtrlR”组合键，按下组合键可快速调整选中文段对齐方式&

st7735屏幕移植-高清图片显示

3天前

文章目录 1、屏幕驱动原理2、配置驱动3、源码最近在b站上看到有这个，是国外的一个大佬做的，主控用的是f103，然后屏幕用的是ST7735的驱动IC，

Nginx搭建静态资源映射实现远程访问服务器上的图片资源

2天前

场景需求是从A系统中预览B系统中抓拍的照片。 B系统在另一条服务器上，照片的路径是绝对路径类似D:aabadao.jpg这样的图片路径。在A系统中查询B系统的数据库能获取图片的路径。需要将此图片路径映射为网络URL，使

【偷偷收藏】10个免费的图片压缩、格式转换、去水印、PDF文件转word、图片转PDF、word等处理网站

2天前

目录 4 个文件处理在线网站 ilovepdf smallpdf convertio docsmall 3 个图片工具在线网站 tinify 智图 ezgif 3 个无版权图片在线网站 pexels pngimg pixab

关于svg（矢量图片）在ie7，ie8中不被支持的的解决办法。

2天前

在做页面的过程中，往往会遇到不清晰的图片。不管是jpg,png,gif哪种图片都有这种情况发生。网上找了好久都没有解决办法，通过做手机端发现svg图片比较好用，有设计用ai

文字转语音播报,兼容多种浏览器

2天前

业务场景：当存在某些今日待办事项的时候，需要进行语音播报通知。并兼容常见的一些浏览器，目前兼容谷歌、IE、火狐、360浏览器、QQ浏览器、搜狗浏览器。1、实例 HTML <iframe style="display:no

怎么截图转文字？4种截图转文字方法分享

2天前

快速准确地从图片中提取文字成为了职场人士和学习者的必备技能。无论是会议记录、文献整理还是灵感收集，掌握截图转文字的技巧都能让工作学习事半功倍。下面给大家分享4种能够截图转文字方法，既高效又简单&a

怎么把电脑图片转文字？只需这几步就可以截图转文字

2天前

大家在日常学习工作中，难免会引用网上一些文章的内容，如果有些文章可以复制粘贴还好，我们能避免很多打字时间；但是如果碰到文章不能复制粘贴的话&#x

计算机如何存储图片的,电脑保存不了截图怎么办？

2天前

原标题：电脑保存不了截图怎么办？ 电脑系统的截图功能，实际使用可以说是十分方便的，而且还可以设置进行延迟操作，十分贴心。但是&a

4种方法可以在电脑浏览器下载网页图片

2天前

手动截图通过F12的审查元素-找到url地址(右键下载、或者通过代码下载)通过F12的审查元素-右键截图通过F12的审查元素-Applicationframetopimages截图具体可参考 https:vip.jokerp

快速保持图片在计算机哪,电脑截图默认保存在哪

2天前

大家好，我是时间财富网智能客服时间君，上述问题将由我为大家进行解答。电脑截图默认保存在电脑的剪贴板里。当再一次用PrintScreen键或者用CtrlC或者CtrlX时，剪

怎么用手机压缩图片？教给大家三种手机压缩图片方法

2天前

如何使用手机把图片的内存进行压缩呢？大家在使用照片的时候，如果照片的内存太大，不仅会占用手机的内存，也会影响一些网站上传图片的操作&#xff0c

一个完全免费的在线文字云网站

2天前

果然只有老外有这个情怀，做这个事情， 在线文字云（不支持中文） Edit word art - WordArt 可以支持选择多种内嵌的文字云外观格式 C

Python爬虫之scrapy框架360全网图片爬取

1天前

Python爬虫之scrapy框架360全网图片爬取在这里先祝贺大家程序员节快乐，在此我也有一个好消息送给大家，本人已开通了微信公众号，我会把资源放在公众号上，还请大家小手动一动，关注过微信公众号，回复1024即可获得python的零基

Python制作简易OCR文字识别系统

1天前

前不久看了一篇“如何使用Python检测和识别车牌？”用OpenCV对输入图像进行预处理，用imutils将原始输入图像裁剪成所需的大小，用pytesseract将提取车牌字

微信粤语语音转文字讯飞输入法更懂粤语直出文字

1天前

微信语音转文字功能在一定程度上缓解了语音消息的压力。但是，如果对方讲的是方言怎么办？日前，腾讯微信团队发微博称，广东地区用户支持粤语语音转文字功能。然而

教你免费白嫖各大知名互联网公司的「文字转语音、语音转文字」服务！

1天前

先说「文字转语音」，再讲「语音转文字」 ▍1 文字转语音文字转语音，国内基本上看讯飞，但百度凭借自身做AI的实力，在语音识别这方面还是不错的 ●

BUUCTF MISC题解-文字

1天前

BUUCTF MISC题解-文字二维码下载附件解压后，得到相应的二维码，采用微信扫描后，获取一句话-secret is here但是这句话并不是flag采用Kail

win10怎么在注册表中修改图片查看方式

5小时前

如果是全新安装的Win10正式版，那么就会发现当在图片上点击右键时，“打开方式”菜单里熟悉的“Windows照片查看器”不见了，换成了Win10全新的“照片”应用。而如果是从

电子爱好者 - 最新技术资讯及电子产品介绍！

利用C#批量从pdf中提取图片和文字(亲身实践绝对有效)

更多相关文章

【PM】【需求】项目管理-需求：管理软件需求分析过程

WPS文字常用排版快捷键

st7735屏幕移植-高清图片显示

Nginx搭建静态资源映射实现远程访问服务器上的图片资源

【偷偷收藏】10个免费的图片压缩、格式转换、去水印、PDF文件转word、图片转PDF、word等处理网站

关于svg（矢量图片）在ie7，ie8中不被支持的的解决办法。

文字转语音播报,兼容多种浏览器

怎么截图转文字？4种截图转文字方法分享

怎么把电脑图片转文字？只需这几步就可以截图转文字

计算机如何存储图片的,电脑保存不了截图怎么办？

4种方法可以在电脑浏览器下载网页图片

快速保持图片在计算机哪,电脑截图默认保存在哪

怎么用手机压缩图片？教给大家三种手机压缩图片方法

一个完全免费的在线文字云网站

Python爬虫之scrapy框架360全网图片爬取

Python制作简易OCR文字识别系统

微信粤语语音转文字 讯飞输入法更懂粤语直出文字

教你免费白嫖各大知名互联网公司的「文字转语音、语音转文字」服务！

BUUCTF MISC题解-文字

win10怎么在注册表中修改图片查看方式

发表评论

推荐文章

谷歌Chrome浏览器接入RTSP海康大华摄像头视频纯H5播放谷歌观看海康摄像头

专杀工具-熊猫烧香

Node.js 和 webpack 下载安装——小白教程

Windows Sublime Text 配置Linux子系统(WSL)下的 shell 编译环境

pool win10提示bad_快速解决Win10出现Bad pool caller蓝屏故障的技巧

热门文章

解决Chrome谷歌浏览器访问网页过慢问题~

两台计算机无法共享链接,[转载]局域网内两台计算机无法互相共享文件

两台电脑实现文件传输共享

局域网有一台计算机网络慢,打开局域网内某一台电脑共享很慢

前端面试题汇总

在虚拟机VirtualBox7.0.6+openEuler20.03TSL上安装部署openGauss3.1.1数据库快速（一键）安装指导手册

Windows系统配置TensorFlow教程

winCE、WinPE、Win Embedded、Windows Mobile的区别

LiuOS操作系统开发实践（二）

嵌入式linux检测U盘拔插

最新文章

猫头虎分享: MathType 7.6 从入门到精通教程

华硕FL5900U笔记本电脑重装win10专业版详细操作教程

ThinkPad X1 Carbon 安装Ubuntu 18.04到移动硬盘 教程指南

重装系统相关操作流程

教你如何制作OS X Lion启动U盘与使用U盘安装系统

微软的mak与kms区别

Autodesk 2015全套密钥

如何使用U盘安装操作系统,非PE安装系统的方法

用U盘安装Ubuntu15.04

不使用 U 盘等任何工具全新安装 Windows 操作系统

Visio专业版 2019激活（步骤详细）

ubuntu14.04 u盘安装教程

ubuntu 18.04 双系统安装

电脑安装ubuntu系统详细教程

无显示器u盘安装centos_从u盘安装centos

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

微信粤语语音转文字讯飞输入法更懂粤语直出文字

ThinkPad X1 Carbon 安装Ubuntu 18.04到移动硬盘教程指南

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载