Comments (9)
PaddleOCR-json 应用程序无法正常启动(0xc0000142)
发生条件:
- CPU不支持AVX指令集
修复方法:
换用 PaddleOCR 之外的插件或软件版本。比如:
- 额外导入 RapleOCR插件 。
- 更换使用 Umi-OCR_Rapid 。
from umi-ocr.
某种语言识别准确率低
(特别是简中、英语
以外的语言,如繁中、日文等)
如果 Umi-OCR 在识别中没有报错,那么这类问题与 Umi 本身无关。
Umi 支持多种离线OCR引擎(详见 插件仓库),它们均为 开源项目 。对于大众语言如 简体中文、英语
,开源项目也可以达到接近商业服务的性能和准度。但受限于 模型训练成本 ,开源项目往往无法投入太多资源来训练 较小众语言 的模型。
因此,类似 繁中、日文、韩文、音标、特殊符号
等语言/字符,在复杂图片中准确率较低,是目前难以避免的。
Umi-OCR 未来计划允许接入在线OCR服务。如果对准确率有较高的要求,未来可以使用百度、腾讯等公司提供的在线收费OCR服务。
同时,如果发现有某款开源引擎在某些领域的识别效果优于现有模型,也欢迎开发者适配,或者提出适配请求。详见插件仓库。
from umi-ocr.
表格识别 / 图片翻译
目前,作者正在筹备一次较大的重构,重新设计软件底层的插件系统,以便支持更丰富的插件,为 表格识别、图片翻译、更完善的Latex识别、跨平台支持 等功能做铺垫。
受限于作者的业余时间、精力等限制,难以在短期内完成这项工作,还请耐心等待。
from umi-ocr.
Linux 与 MacOS 支持
跨平台的支持已在本项目的未来计划之中。在开发之初, Umi-OCR v2 就为跨平台预留了代码接口,依赖的第三方组件也选用了支持跨平台的方案。目前,还需等待插件系统重构完成。
受限于作者的业余时间、精力等限制,难以在短期内完成这项工作,还请耐心等待。
第三方 方案:
- Umi-OCR 部署 Docker
目前支持 Linux 与 MacOS 的开源OCR软件:
from umi-ocr.
GPU加速
此功能在长线计划内。目前由开发者 qwedc001 负责主要工作,进展见 RapidOCR-json-gpu/releases 。
但是,GPU加速依赖的CUDA环境调配较为复杂,设备兼容性较差。对于非开发者的普通用户而言,安装、配置、调试的门槛较高。我们正在研究如何让普通人能更轻松地使用它。
欢迎更多愿意帮忙测试或者提供贡献的用户来推进GPU计划,您需要有一块支持CUDA的Nvidia显卡。如有兴趣,请浏览 RapidOCR-json-gpu 项目,并在该仓库的Issues中交流。
from umi-ocr.
启动软件时,错误弹窗:
Failed to create OpenGL context for format QSurfaceFormat(version 2.0, options QFlagsQSurfaceFormat:FormatOption0,depthBufferSize24 redBufferSize -1,greenBufferSize -1,blueBufferSize -1, alphaBufferSize 8, stencilBufferSize 8, samples -1, swapBehavior QSurfaceFormat:DoubleBuffer, swaplnterval 1, colorSpace QSurfaceFormat:DefaultColorSpace, profile QSurfaceFormat:NoProfile).
This is most likely caused by not having the necessary graphics drivers installed.Install a driver providing OpenGL 2.0 or higher, or, if this is not
possible, make sure the ANGLE Open GL ES 2.0 emulation libraries (libEGL.dll, libGLESv2.dll and d3dcompiler_*.dll) are available in the application executable's directory or in a location listedinPATH.
可能的发生条件:
- win7 早期版本,或更老的windows系统
- 显卡驱动不全,或显卡(包括核显)型号太老
- 部分虚拟机环境
修复方法:
解压,将其中的两个dll文件放置于 UmiOCR-data/site-packages/PySide2/
from umi-ocr.
弹出黑框控制台窗口,【错误】Umi-OCR Error 找不到指定的程序 OSError
对于 v2.1.1
及以上版本,启动软件时弹出一个黑色控制台窗口,显示类似如下的报错信息。
对于 v2.1.1
以下版本,启动软件时什么反应都没有,但是在cmd中打开软件时,显示类似如下的报错信息。
【错误】 Umi-OCR Error: Failed to initialize running environment!
OSError: [WinError 127] 找不到指定的程序。: '...\\UmiOCR-data\\site-packages\\shiboken2'
raise ImportError<'this platform is not supported: <>'.format
importError: DLL Load failed while importing _ctypes: 参数错误
可能的发生条件:
- win7早期版本,缺少系统补丁(尤其是
KB2533623
) - 其他原因,导致 Python 3.8 无法在该系统中运行。
修复方法:
推荐方法:使用系统检查更新(控制面板 → 系统和安全 → Windows Update → 检查更新
),安装所有更新。
另一种方法:单独下载安装 KB2533623补丁 ( Windows6.1-KB2533623-x64.msu
) ,重启系统即可。不过,微软的 官方渠道 已经关闭了该补丁的下载链接,您可能只能从第三方网站下载补丁,请务必注意安全。
from umi-ocr.
保存PDF时 “已停止工作”
文档识别,能识别出文字,能保存为txt等文件。但如果选择保存为双层可搜索PDF
,则最后导出文件时弹窗报错:
Umi-OCR.exe 已停止工作
查看问题详细信息:
问题事件名称:BEX64
故障模块名称:ucrtbase.DLL
故障模块版本:10.0.10240.16390
异常偏移:00000000064399
异常代码:c0000417
可能的发生条件:
win7早期版本,缺少系统补丁(尤其是 KB4534310
、KB3042058
)
修复方法:
注意!由于 KB4534310
依赖前置补丁,因此 不能 单独下载安装该补丁。
您必须使用系统检查更新(控制面板 → 系统和安全 → Windows Update → 检查更新
),安装所有缺失的更新,直到这个项目安装完毕:
2020-01 适用于基于 x64 的系统的 Windows 7 月度安全质量汇总 (KB4534310)
温馨提示,如果自动升级的过程中出现 80092004
的安装错误,实测 这个做法 有效。
如下图,直到安装了这些更新,就能解决PDF无法保存的问题。
from umi-ocr.
丢失api-ms-win-crt-runtime-l1-1-0.dll
打开软件时,依次弹出以下两个错误弹窗:
Umi-OCR.exe-系统错误
无法启动此程序,因为计算机中丢失 api-ms-win-crt-runtime-l1-1-0.dll 。尝试重新安装该程序以解决此问题。
ERROR
Cannot find Py_Main() in:
...\Umi-OCR\UmioCR-data\runtime\python3.dll
可能的发生条件:
缺少VC运行库
修复方法:
安装 VC运行库(点击下载) 。随后如果出现不同的报错,请参考本贴的其它条目解决。
from umi-ocr.
Related Issues (20)
- ui界面乱码白屏 HOT 3
- 能不能把GPU也给它用上 HOT 2
- 建议 HOT 11
- 低版本cpu问题,换Umi-OCR_Rapid解决了 HOT 1
- 建议:改进系统右键菜单显示逻辑,可大幅提升使用效率(附想象图) HOT 8
- [已解决]某些pdf识别后文本层每页都有一定程度的错位(附样本) HOT 10
- 建议增加微信OCR插件 HOT 2
- Add an option to generate one layer PDF file output HOT 1
- 无法识别HEIC编码的图片,错误码203 HOT 26
- 你好,文件没有上传成功哦。要等 `[](https://...........)` 链接刷出来,才点击 Comment 。
- 系统能够识别并将PDF文件中的表格转换为可读的Markdown格式 HOT 3
- OCR pdf支持检测校正pdf倾斜 HOT 1
- 文字与向量公式混排的时候,向量识别有误。 HOT 2
- 作者大牛。可以把pdf识别http接口先上吗 HOT 1
- 不支持Win7,验证所有版本无法运行 HOT 6
- 异常状态码:203 HOT 3
- windows2008部署报错,出现各种mfplat.dll与各种api-ms-core各种dll报错
- windows 2008 各种dll补丁打完后报错提示 HOT 1
- 竖版识别出错,建议给一个竖版识别的按钮! HOT 1
- 批量OCR功能识别PNG图片报错203提示 HOT 2
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from umi-ocr.