【开源分享】Star 16.9k ，图片转文字识别软件:Umi-OCR

超级管理员

2024-06-05

文字识别

Umi-OCR 文字识别工具

免费，开源，可批量的离线OCR软件
适用于 Windows7 x64 及以上

免费：本项目所有代码开源，完全免费。
方便：解压即用，离线运行，无需网络。
高效：自带高效率的离线OCR引擎，内置多种语言识别库。
灵活：支持命令行、HTTP接口等外部调用方式。
功能：截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别（测试中）

源码地址

https://github.com/hiroi-sora/Umi-OCR

下载发行版

以下发布链接均长期维护，提供最新软件版本。

蓝奏云 https://hiroi-sora.lanzoul.com/s/umi-ocr （国内推荐，免注册/无限速）
GitHub https://github.com/hiroi-sora/Umi-OCR/releases/latest
Source Forge https://sourceforge.net/projects/umi-ocr

• Scoop Installer（点击展开）

Scoop 是一款Windows下的命令行安装程序，可方便地管理多个应用。您可以先安装 Scoop ，再使用以下指令安装 Umi-OCR ：

添加 extras 桶：

scoop bucket add extras

（可选1）安装 Umi-OCR（自带 Rapid-OCR 引擎，兼容性好）：

scoop install extras/umi-ocr

（可选2）安装 Umi-OCR（自带 Paddle-OCR 引擎，速度稍快）：

scoop install extras/umi-ocr-paddle

不要同时安装二者，快捷方式可能会被覆盖。但您可以额外导入插件，随时切换不同OCR引擎。

开始使用

软件发布包下载为 .7z 压缩包或 .7z.exe 自解压包。自解压包可在没有安装压缩软件的电脑上，解压文件。

本软件无需安装。解压后，点击 Umi-OCR.exe 即可启动程序。

遇到任何问题，请提 Issue ，我会尽可能帮助你。

界面语言

Umi-OCR 支持的界面多国语言。在第一次打开软件时，将会按照你的电脑的系统设置，自动切换语言。

如果需要手动切换语言，请参考下图，全局设置→语言/Language 。

标签页

Umi-OCR v2 由一系列灵活好用的标签页组成。您可按照自己的喜好，打开需要的标签页。

标签栏左上角可以切换窗口置顶。右上角能够锁定标签页，以防止日常使用中误触关闭标签页。

截图OCR

截图OCR：打开这一页后，就可以用快捷键唤起截图，识别图中的文字。

左侧的图片预览栏，可直接用鼠标划选复制。
右侧的识别记录栏，可以编辑文字，允许划选多个记录复制。
也支持在别处复制图片，粘贴到Umi-OCR进行识别。

文本后处理

关于 OCR文本后处理 - 排版解析方案：可以整理OCR结果的排版和顺序，使文本更适合阅读和使用。预设方案：

多栏-按自然段换行：适合大部分情景，自动识别多栏布局，按自然段规则进行换行。
多栏-总是换行：每段语句都进行换行。
多栏-无换行：强制将所有语句合并到同一行。
单栏-按自然段换行/总是换行/无换行：与上述类似，不过不区分多栏布局。
单栏-保留缩进：适用于解析代码截图，保留行首缩进和行中空格。
不做处理：OCR引擎的原始输出，默认每段语句都进行换行。

上述方案，均能自动处理横排和竖排（从右到左）的排版。（竖排文字还需要OCR引擎本身支持）

批量OCR

批量OCR：这一页用于批量导入本地图片进行识别。

支持格式：jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff。
保存识别结果的支持格式：txt, jsonl, md, csv(Excel)。
与截图OCR一样，支持文本后处理功能，整理OCR文本的排版和顺序。
没有数量上限，可一次性导入几百张图片进行任务。
支持任务完成后自动关机/待机。
如果要识别像素超大的长图或大图，请调整：页面的设置→文字识别→限制图像边长→【调高数值】。
拥有特殊功能忽略区域。

忽略区域

关于 OCR文本后处理 - 忽略区域：批量OCR中的一种特殊功能，适用于排除图片中的不想要的文字。

在批量识别页的右栏设置中可进入忽略区域编辑器。
如上方样例，图片顶部和右下角存在多个水印 / LOGO。如果批量识别这类图片，水印会对识别结果造成干扰。
按住右键，绘制多个矩形框。这些区域内的文字将在任务中被忽略。
请尽量将矩形框画得大一些，完全包裹住水印所有可能出现的位置。

文档识别

文档识别：

支持格式：pdf, xps, epub, mobi, fb2, cbz。
对扫描件进行OCR，或提取原有文本。可输出为双层可搜索PDF 。
支持设定忽略区域，可用于排除页眉页脚的文字。
可设置任务完成后自动关机/休眠。

二维码

扫码：

截图/粘贴/拖入本地图片，读取其中的二维码、条形码。
支持一图多码。
支持19种协议，如下：

Aztec,Codabar,Code128,Code39,Code93,DataBar,DataBarExpanded,DataMatrix,EAN13,EAN8,ITF,LinearCodes,MatrixCodes,MaxiCode,MicroQRCode,PDF417,QRCode,UPCA,UPCE

生成码：

输入文本，生成二维码图片。
支持19种协议和纠错等级等参数。

全局设置

全局设置：在这里可以调整软件的全局参数。常用功能如下：

一键添加快捷方式或设置开机自启。
更改界面语言。Umi支持繁中、英语、日语等语言。
切换界面主题。Umi拥有多个亮/暗主题。
调整界面文字的大小和字体。
切换OCR插件。
渲染器：软件界面默认支持显卡加速渲染。如果在你的机器上出现截屏闪烁、UI错位的情况，请调整界面和外观 → 渲染器，尝试切换到不同渲染方案，或关闭硬件加速。

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

开源网盘神器 AList 项目移交公司运营，创始人继续参与开源监管

知名的开源自建网盘解决方案 AList 近日迎来重要运营变动。该项目创始人 Xhofe 在其官方 Telegram 频道宣布，AList 项目已经正式移交给一家公司进行运营。关于 AList AList 是一款广受欢迎的开源软件（文件列表程序），允许用户在多种设备（如 VPS 服务器、NAS 或

超级管理员

56 0

开源项目

【开源分享】 Star 6.8k，小米开源 Home Assistant 米家集成

项目介绍米家集成是一个由小米官方提供支持的 Home Assistant 的集成组件，它可以让您在 Home Assistant 中使用小米 IoT 智能设备。项目原理云端控制

咬到舌头的小蛇

157 0

开源项目

【开源分享】Star 6.4k，自托管的浏览器书签管理平台

项目介绍该项目是基于 Django 构建的浏览器书签管理平台，它提供了简洁易用的 Web 界面和强大的搜索功能，支持标签分类、批量编辑和稍后阅读等功能，并配有 Chrome 和 Firefox 插件，方便用户随时随地保存和访问书签。项目截图

咬到舌头的小蛇

109 0

开源项目

【开源分享】Star 4.4k，游戏修改器管理工具

项目介绍 Game Cheats Manager 为玩家提供了一个高效管理游戏修改器的一站式解决方案。它允许用户在一个便捷的位置浏览、下载和管理所有修改器。每个修改器，通常是一个独立的可执行文件，都可以通过应用程序直接启动或删除，从而简化您的游戏体验。项目截图使用

咬到舌头的小蛇

250 0

【开源分享】Star 16.9k ，图片转文字识别软件:Umi-OCR

Umi-OCR 文字识别工具

源码地址

下载发行版

开始使用

界面语言

标签页

截图OCR

文本后处理

批量OCR

忽略区域

文档识别

二维码

全局设置

推荐阅读

开源网盘神器 AList 项目移交公司运营，创始人继续参与开源监管​

【开源分享】 Star 6.8k，小米开源 Home Assistant 米家集成

【开源分享】Star 6.4k，自托管的浏览器书签管理平台

【开源分享】Star 4.4k，游戏修改器管理工具

评论

开源网盘神器 AList 项目移交公司运营，创始人继续参与开源监管