Total Pageviews

Friday, 1 July 2022

DangoOCR

 基于PaddleOCR搭建的OCR server... 离线部署用。

开头说明

​ DangoOCR 是基于大家的 CPU处理器 来运行的,CPU处理器 的好坏会直接影响其速度但不会影响识别的精度,目前此版本识别速度可能在 0.5-3秒之间,具体取决于大家机器的配置,可以的话尽量不要在运行时开其他太多东西。需要配合团子翻译器 Ver3.6 及其以上的版本才可以使用!

​ 此项目底层基于百度开源的PaddleOCR搭建,这是团子第一次尝试自己封装离线的OCR,遇到了不少坑,也受到了不少人的帮助才顺利完成这第一个版本此离线版本以后都会开源,团子也会慢慢优化它的精度和速度,也欢迎对OCR领域有所研究的大佬能一起讨论研究。

项目相关

DangoOCR 源码地址 希望能收到你点的 Star ~ 团子感激不尽

ps:此文档为离线文档,相关说明和问题集可能会过时,如果此文档不能帮助你解决问题,请直接查看 DangoOCR 源码地址

团子翻译器 源码地址 配合翻译器 Ver3.6 及其以上版本使用,啃生肉!

b站个人主页 关于 团子翻译器 和 团子OCR 的任何事宜,团子都会第一时间在b站的动态发布,关不关注你看着办~

团子QQ:394883561 邮箱:394883561@qq.com

特别鸣谢

PaddleOCR 项目地址 项目底层基于此框架搭建

QPT 打包工具地址 推荐开发者了解一下这个打包工具,比 pyinstaller 好用!DangoOCR 就是使用此工具打包的 ~ 感谢作者。

使用前注意

  1. 只可以运行在 x64 位的系统,x86 32位的系统可以暂时不支持;
  2. 只支持windows,windows7-10都可以,windows7以下不行,mac和移动端和linux都不支持;
  3. 使用前务必关掉所有杀毒软件,不然被误杀导致文件缺失无法启动自己想办法;
  4. 只可以运行在全英文的路径,路径中不能含有中文或者中文类型的字符;
  5. 路径不可以带有空格;

以后的版本可能会修复以上问题

image-20210704214037559

路径带的 "团子" ,有中文启动会失败。

image-20210701223423557

image-20210701224518547

特别说明

对于盘符,D盘C盘E盘,盘符及其之前的路径带有中文是没有关系,不会影响的。

image-20210701224626396

安装和启动

第一次启动需要初始化(安装),切勿关闭黑色的运行窗口,待进度条满后初始化完毕,只有第一次启动才会有进度条

image-20210704212345901

中途这些红色的错误不需要在意,不影响,等它一直运行就好了

image-20210704212736642

如弹出,点允许访问

image-20210701223004058

出现如下情况,则启动完毕,可以配合翻译器直接使用了,使用过程中千万不可以关掉此运行的黑窗口,直接缩小即可

image-20210701223025840

注意翻译器此处不要打勾,不要打勾,如果打勾就是使用百度的OCR,当然你有高额度的百度OCR账号优先用百度OCR会更好。

image-20210701235359751

测试工具

可以在不使用翻译器的情况下简单测试自己的 DangoOCR 是否正常

image-20210701235626384

记得先完成 DangoOCR 的运行,再启动此脚本测试,可以测试使用速度

image-20210701235640888

如图完成测试,团子的测试结果是平均 0.81s,垃圾CPU

image-20210701235941050

已知的问题和解决方案

计算机名中文

image-20210704213040053

出现如上图的错误的话,按照如下方法解决:

image-20210704213157922

错误是由于你的计算机名带有汉字或者一些奇葩字符导致的,需要修改成英文或者数字

image-20210704213215736

修改完成后保存重启 DangoOCR 即可。

image-20210704213258783

缺少vc++2017运行环境

image-20210704213642176

image-20210704213853088

缺少 mkl 驱动:

一些盗版系统或者老版系统可能会没有 mkl 驱动,DangoOCR 需要此驱动来加速 OCR 的识别速度

image-20210704214127025

参考此链接文章处理

image-20210704214251847

解压后都丢到 C:\Windows\System32 就可以解决了。

from https://github.com/PantsuDango/DangoOCR

(https://cloud.stariver.org/)

-------

团子翻译器 —— 个人兴趣制作的一款基于OCR技术的翻译器  。

团子翻译器 - 基于OCR的生肉翻译软件

最新版本 更新时间 更新时间 GitHubStars GitHubForks 作者 群号

简介

团子翻译器是一款生肉翻译软件,通过OCR识别屏幕特定范围内的文字,然后将识别到的文字调取各大厂的翻译,并输出翻译结果。

  • 搭载了离线OCR,项目地址:DangoOCR
  • 搭载了在线OCR,官网地址:星河云OCR
  • 实现自动模式,循环识别区域内的文本并翻译
  • 配置了9种翻译源
  • 账号系统,能够自动云端保存配置

安装版下载

更新日志

翻译器相关

最新版本 更新时间

  • 修复串台, 出现其他人的翻译内容问题(大概);
  • 修改了翻译出错时"我抽风啦"的说法;
  • 更多更新日志:查看

OCR相关

最新版本 更新时间

  • 优化了识别速度和识别质量;

  • 优化了对个别环境的适配问题

  • 更多更新日志:查看

原理说明

更新计划

新增项

  • 升级Ver4.0,全新的界面设计,更舒服的交互
  • 加入DeepL 翻译
  • 离线OCR加入GPU模式
  • 加入云服务在线OCR(收费)
  • 加入自定义OCR API接口功能,可以自由添加想要的OCR API接口(需要略懂开发)

优化项

  • 优化公共翻译和网页翻译,提高翻译质量,降低抽风率
  • 离线OCR取消黑窗,加入简单的GUI界面,最小化从任务栏改为系统托盘
  • 对屏幕缩放比例175%以上做适配
  • 离线OCR加入竖排文本检测模式用于翻译生肉本

修复项

  • 修复快捷键会失效的问题
  • 修复手动模式下,程序概率卡死的问题
  • 修复多屏模式下,副屏幕无法截图的问题

特别鸣谢

PaddleOCR 离线OCR基于此框架搭建

QPT打包工具 离线OCR基于此工具打包

GT-Zhang 离线OCR开发过程给予了诸多帮助的大佬

C4a15Wh 星团云在线OCR主力开发

Cypas_Nya 在线教程文档、团子云盘搭建者

设置界面

 from  https://github.com/PantsuDango/Dango-Translator

(https://docs2.ayano.top/#/4.0/basic/start)

(基于OCR技术的翻译器-团子翻译器

团子翻译器是一款开源的“生肉”翻译软件,通过OCR识别屏幕特定范围内的文字,然后将识别到的文字调取各大厂的翻译,并输出翻译结果。软件基于Python编写,遵守LGPL开源协议。

功能特色:

    采取OCR技术,可支持离线OCR或云端OCR
    实现自动模式,循环识别区域内的文本并翻译
    游戏翻译,只需要在后台运行软件,即可自动翻译游戏每一帧画面的语言。
    图片文字类的翻译时,用户可利用软件进行截取外语文字,快速翻译
    视频界面软件可自动加载屏幕上的字幕,然后通过字母的语言快速翻译
    配置了9种翻译源
    账号系统,能够自动云端保存配置

源码:https://github.com/PantsuDango/Dango-Translator)

 

No comments:

Post a Comment