rapidocr-onnxruntime库及在open-webui上传PDF 图像处理 (使用 OCR)应用|电子爱好者

admin管理员组
文章数量:1564179

背景

rapidocr-onnxruntime是一个跨平台的OCR库，基于ONNXRuntime推理框架。

目前已知运行速度最快、支持最广，完全开源免费并支持离线快速部署的多平台多语言OCR。
缘起：百度paddle工程化不是太好，为了方便大家在各种端上进行ocr推理，
我们将它转换为onnx格式，使用Python/C++/Java/Swift/C# 将它移植到各个平台。
名称来源：轻快好省并智能。基于深度学习技术的OCR技术，主打人工智能优势及小模型，以速度为使命，效果为主导。

rapidocr-onnxruntime · PyPI

pip install rapidocr-onnxruntime

注：ONNXRuntime是微软推出的一款推理框架，用户可以非常便利的用其运行一个onnx模型。ONNXRuntime支持多种运行后端包括CPU，GPU，TensorRT，DML等。可以说ONNXRuntime是对ONNX模型最原生的支持。

1、单独离线部署RapidOcr，可以参考这个博客文档：
RapidOcr-Onnxruntime实现离线文字识别(依赖库) https://www.52pojie/thread-1834278-1-1.html

2、本文重点是阐述在本地大语言模型提供图形化界面的开源项目库Open WebUI 中PDF文件（使用OCR做图像处理）的应用。

open-webui上传PDF 图像处理 (使用 OCR)

在Open WebUI安装运行时，默认PDF文件是只支持转文本部分，不使用OCR做图像处理。即下图中的该项功能是关闭状态。

在我们的实验中（linux环境，centos系统），我们尝试打开该项功能，即对于PDF中图像包含的文字，能够通过OCR识别软件做处理。

但是，当我们把上图开关启动（使用OCR）后，在open-webui对话框上传PDF文件，会报如下错误：Something went wrong :/ `rapidocr-onnxruntime` package not found, please install it with `pip install rapidocr-onnxruntime`。
查看了相关资料，解决过程如下：

1、直接运行安装命令：pip install rapidocr-onnxruntime

未能按照，给出如下提示，pip在‘root’权限下，不允许安装，建议虚拟环境安装。

WARNING: Running pip as the 'root' user can result in broken permissions and conflicting behaviour with the system package manager. It is recommended to use a virtual environment instead: https://pip.pypa.io/warnings/venv

于是，参考pip虚拟环境设置： https://docs.python/3/tutorial/venv.html

成功运行，命令如下：

(open-webui) [root@master ~]# python -m venv tutorial-env
(open-webui) [root@master ~]# source tutorial-env/bin/activate
(tutorial-env) (open-webui) [root@master ~]# pip install rapidocr-onnxruntime

Installing collected packages: pyclipper, mpmath, flatbuffers, sympy, six, PyYAML, protobuf, Pillow, packaging, numpy, humanfriendly, Shapely, opencv-python, coloredlogs, onnxruntime, rapidocr-onnxruntime
Successfully installed Pillow-10.3.0 PyYAML-6.0.1 Shapely-2.0.4 coloredlogs-15.0.1 flatbuffers-24.3.25 humanfriendly-10.0 mpmath-1.3.0 numpy-2.0.0 onnxruntime-1.18.0 opencv-python-4.10.0.84 packaging-24.1 protobuf-5.27.1 pyclipper-1.3.0.post5 rapidocr-onnxruntime-1.3.22 six-1.16.0 sympy-1.12.1

虽然rapidocr安装成功了，重启open-webui服务，发现仍然无法上传pdf文件。

查看资料并且单独在python环境测试导入rapidocr库，发现会报错：

ImportError: libGL.so.1: cannot open shared object file: No such file or directory

(open-webui) [root@master backend]# python
Python 3.10.14 (main, May  6 2024, 19:42:50) [GCC 11.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> from rapidocr_onnxruntime import RapidOCR
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/root/miniconda3/envs/open-webui/lib/python3.10/site-packages/rapidocr_onnxruntime/__init__.py", line 4, in <module>
    from .main import RapidOCR
  File "/root/miniconda3/envs/open-webui/lib/python3.10/site-packages/rapidocr_onnxruntime/main.py", line 8, in <module>
    import cv2
  File "/root/miniconda3/envs/open-webui/lib/python3.10/site-packages/cv2/__init__.py", line 181, in <module>
    bootstrap()
  File "/root/miniconda3/envs/open-webui/lib/python3.10/site-packages/cv2/__init__.py", line 153, in bootstrap
    native_module = importlib.import_module("cv2")
  File "/root/miniconda3/envs/open-webui/lib/python3.10/importlib/__init__.py", line 126, in import_module
    return _bootstrap._gcd_import(name[level:], package, level)
ImportError: libGL.so.1: cannot open shared object file: No such file or directory

解决方案：sudo yum install mesa-libGL

(open-webui) [root@master backend]# sudo yum install mesa-libGL

成功安装后。

再次启动运行webUI，可以正确上传解析PDF文件。

大概测试了一下， rapidocr库，对于pdf文本格式（印刷体）转换成文本的准确率较高（95%+），但是对于手写文字（来自几位医生），识别准确率稍差（约60%）。

参考资料：

bug: [RAG] v0.1.109 Breaks PDF upload #1069

Issue: Pypdf extract_image=True is not working on docker(production) #15576

[Windows] RapidOCR 1.3.0安装使用

本文标签：图像处理上传 Open rapidocr onnxruntime

版权声明：本文标题：rapidocr-onnxruntime库及在open-webui上传PDF 图像处理 (使用 OCR)应用内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1726597173a1076965.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

rapidocr-onnxruntime库及在open-webui上传PDF 图像处理 (使用 OCR)应用

背景

open-webui上传PDF 图像处理 (使用 OCR)

更多相关文章

出现Error: could not open `D:java_jdkjre1.8libamd64jvm.cfg问题解决

360浏览器window.open被拦截

Open BMC开发系列（十）配置串口可以输出BIOS信息

LLMs之FLM-101B：《FLM-101B: An Open LLM and How to Train It with $100K Budget一个开放的LLM和如何用10万美元的预算训练训它》翻

如何学习图像处理（计算机视觉）的一些思考与分享

关于谷歌浏览器无法拖动上传的原因

photoshop自动切图，导出svg，支持阿里巴巴图标库上传相互转换

图像处理与计算机视觉的经典书籍

openstack 镜像上传和下载

百度网盘开放平台接口，上传、下载等功能PHP详细操作

Open API Initiative发布OpenAPI规范3.0.0

理解OCI（Open Container Initiative）及docker的OCI实现(转)

GlassFish The Open Source Java EE Reference Implementation

Amazon ECR 是否支持 Open Container Initiative (OCI) 格式？

小马激活软件报错 can not open file：COEMSF

JAVA WEB项目大文件上传下载方法

APP软件上传安卓苹果应用商店上架APP应用市场

Android 应用市场链接上传地址

App上传应用市场的步骤有哪些能上传哪些应用市场

stm32f103c8t6+ESP8266利用onenet平台上传数据到云平台，再利用云平台远程下发命令给单片机控制LED灯亮灭

发表评论

推荐文章

android 应用市场图尺寸,【干货】最新App应用市场截图尺寸大全

计算机开启多核方法,Win10系统电脑怎么实现多核启动的详细操作教程

android 9.0 10.0 开机连接指定wifi

H5定位PC浏览器不能精确定位，但是手机浏览器可以精确定位

天翼云电脑实现不关机Python（nodejs）代码

热门文章

网购组装电脑整机为什么便宜？

实现远程开机（电脑）的各种方法总结

win8win8.1提示在关闭了用户控制的情况下 无法打开这个应用

坑DIE的 win10开机无限自动检测修复D盘

手机浏览器window.close()无效（黑科技）

关于linux装Centos6.3 U盘启动（转载，觉得很给力）

重要的Linux系统文件介绍

加速微软云服务在中国大陆的连接体验

鲁大师2021年度手机报告：5大“最强”手机揭晓，还有最流畅UI

如何在两台电脑之间共享文件

最新文章

Android 10.0 app获取当前已连接wifi列表ssid和密码功能实现

再一次获取你的WIFI密码（fluxion附视频）

分分钟搞定python破解无线wifi

记一次老手机连接Wifi显示已保存，却不真正连接

安卓手机WiFi信号桥，增强版个人热点，wifi中继（第三方软件设置）root权限设置增强版个人热点名称密码

修改家中的WiFi密码

越狱iPhone手机使用openSSH wifi和usb连接mac电脑再免密码登录再用shell脚本执行教程

android 手机wifi重启,android – 如何通过重启来记住wifi配置和连接网络

android wifi名称修改器,360随身WIFI(SSID)名称修改工具v1.5.0

教你如何查看连接过的wifi密码

[MT8766][Android12] 修改WIFI热点默认名称、密码、IP地址以及默认开启热点

真正的手机破解wifi密码，aircrack-ng,reaver,仅限mx2（BCM4330芯片）

kali linux破解wifi密码-超详细过程

MAC系统下破解WIFI密码

Android Wifi热点通信，及Android7.0上修改手机连接wifi方法，和其他大神提供的方法稍作修改

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

win8win8.1提示在关闭了用户控制的情况下无法打开这个应用

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载