Code Monkey home page Code Monkey logo

Comments (9)

hiroi-sora avatar hiroi-sora commented on June 9, 2024

PaddleOCR-json 应用程序无法正常启动(0xc0000142)

发生条件:

  • CPU不支持AVX指令集

修复方法:

换用 PaddleOCR 之外的插件或软件版本。比如:

from umi-ocr.

hiroi-sora avatar hiroi-sora commented on June 9, 2024

某种语言识别准确率低

(特别是简中、英语以外的语言,如繁中、日文等)

如果 Umi-OCR 在识别中没有报错,那么这类问题与 Umi 本身无关。

Umi 支持多种离线OCR引擎(详见 插件仓库),它们均为 开源项目 。对于大众语言如 简体中文、英语,开源项目也可以达到接近商业服务的性能和准度。但受限于 模型训练成本 ,开源项目往往无法投入太多资源来训练 较小众语言 的模型。

因此,类似 繁中、日文、韩文、音标、特殊符号 等语言/字符,在复杂图片中准确率较低,是目前难以避免的。

Umi-OCR 未来计划允许接入在线OCR服务。如果对准确率有较高的要求,未来可以使用百度、腾讯等公司提供的在线收费OCR服务。

同时,如果发现有某款开源引擎在某些领域的识别效果优于现有模型,也欢迎开发者适配,或者提出适配请求。详见插件仓库。

from umi-ocr.

hiroi-sora avatar hiroi-sora commented on June 9, 2024

表格识别 / 图片翻译

目前,作者正在筹备一次较大的重构,重新设计软件底层的插件系统,以便支持更丰富的插件,为 表格识别图片翻译、更完善的Latex识别、跨平台支持 等功能做铺垫。

受限于作者的业余时间、精力等限制,难以在短期内完成这项工作,还请耐心等待。

from umi-ocr.

hiroi-sora avatar hiroi-sora commented on June 9, 2024

Linux 与 MacOS 支持

跨平台的支持已在本项目的未来计划之中。在开发之初, Umi-OCR v2 就为跨平台预留了代码接口,依赖的第三方组件也选用了支持跨平台的方案。目前,还需等待插件系统重构完成。

受限于作者的业余时间、精力等限制,难以在短期内完成这项工作,还请耐心等待。

第三方 方案:

目前支持 Linux 与 MacOS 的开源OCR软件:

from umi-ocr.

hiroi-sora avatar hiroi-sora commented on June 9, 2024

GPU加速

此功能在长线计划内。目前由开发者 qwedc001 负责主要工作,进展见 RapidOCR-json-gpu/releases

但是,GPU加速依赖的CUDA环境调配较为复杂,设备兼容性较差。对于非开发者的普通用户而言,安装、配置、调试的门槛较高。我们正在研究如何让普通人能更轻松地使用它。

欢迎更多愿意帮忙测试或者提供贡献的用户来推进GPU计划,您需要有一块支持CUDA的Nvidia显卡。如有兴趣,请浏览 RapidOCR-json-gpu 项目,并在该仓库的Issues中交流。

from umi-ocr.

hiroi-sora avatar hiroi-sora commented on June 9, 2024

启动软件时,错误弹窗:

Failed to create OpenGL context for format QSurfaceFormat(version 2.0, options QFlagsQSurfaceFormat:FormatOption0,depthBufferSize24 redBufferSize -1,greenBufferSize -1,blueBufferSize -1, alphaBufferSize 8, stencilBufferSize 8, samples -1, swapBehavior QSurfaceFormat:DoubleBuffer, swaplnterval 1, colorSpace QSurfaceFormat:DefaultColorSpace, profile QSurfaceFormat:NoProfile).
This is most likely caused by not having the necessary graphics drivers installed.

Install a driver providing OpenGL 2.0 or higher, or, if this is not
possible, make sure the ANGLE Open GL ES 2.0 emulation libraries (libEGL.dll, libGLESv2.dll and d3dcompiler_*.dll) are available in the application executable's directory or in a location listedinPATH.

可能的发生条件:

  • win7 早期版本,或更老的windows系统
  • 显卡驱动不全,或显卡(包括核显)型号太老
  • 部分虚拟机环境

修复方法:

下载: opengl32sw_x64.zip

解压,将其中的两个dll文件放置于 UmiOCR-data/site-packages/PySide2/

from umi-ocr.

hiroi-sora avatar hiroi-sora commented on June 9, 2024

弹出黑框控制台窗口,【错误】Umi-OCR Error 找不到指定的程序 OSError

对于 v2.1.1 及以上版本,启动软件时弹出一个黑色控制台窗口,显示类似如下的报错信息。
对于 v2.1.1 以下版本,启动软件时什么反应都没有,但是在cmd中打开软件时,显示类似如下的报错信息。

【错误】 Umi-OCR Error: Failed to initialize running environment!

OSError: [WinError 127] 找不到指定的程序。: '...\\UmiOCR-data\\site-packages\\shiboken2'

raise ImportError<'this platform is not supported: <>'.format  
importError: DLL Load failed while importing _ctypes: 参数错误

image
image

可能的发生条件:

  • win7早期版本,缺少系统补丁(尤其是KB2533623
  • 其他原因,导致 Python 3.8 无法在该系统中运行。

修复方法:

推荐方法:使用系统检查更新(控制面板 → 系统和安全 → Windows Update → 检查更新),安装所有更新。

另一种方法:单独下载安装 KB2533623补丁Windows6.1-KB2533623-x64.msu ) ,重启系统即可。不过,微软的 官方渠道 已经关闭了该补丁的下载链接,您可能只能从第三方网站下载补丁,请务必注意安全。

from umi-ocr.

hiroi-sora avatar hiroi-sora commented on June 9, 2024

保存PDF时 “已停止工作”

文档识别,能识别出文字,能保存为txt等文件。但如果选择保存为双层可搜索PDF,则最后导出文件时弹窗报错:

Umi-OCR.exe 已停止工作

查看问题详细信息:

问题事件名称:BEX64
故障模块名称:ucrtbase.DLL
故障模块版本:10.0.10240.16390
异常偏移:00000000064399
异常代码:c0000417

可能的发生条件:

win7早期版本,缺少系统补丁(尤其是 KB4534310KB3042058

修复方法:

注意!由于 KB4534310 依赖前置补丁,因此 不能 单独下载安装该补丁。

您必须使用系统检查更新(控制面板 → 系统和安全 → Windows Update → 检查更新),安装所有缺失的更新,直到这个项目安装完毕:

2020-01 适用于基于 x64 的系统的 Windows 7 月度安全质量汇总 (KB4534310)

温馨提示,如果自动升级的过程中出现 80092004 的安装错误,实测 这个做法 有效。

如下图,直到安装了这些更新,就能解决PDF无法保存的问题。

image

from umi-ocr.

hiroi-sora avatar hiroi-sora commented on June 9, 2024

丢失api-ms-win-crt-runtime-l1-1-0.dll

打开软件时,依次弹出以下两个错误弹窗:

Umi-OCR.exe-系统错误
无法启动此程序,因为计算机中丢失 api-ms-win-crt-runtime-l1-1-0.dll 。尝试重新安装该程序以解决此问题。

image

ERROR
Cannot find Py_Main() in:
...\Umi-OCR\UmioCR-data\runtime\python3.dll

image

可能的发生条件:

缺少VC运行库

修复方法:

安装 VC运行库(点击下载) 。随后如果出现不同的报错,请参考本贴的其它条目解决。

from umi-ocr.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.