Convert AI papers to GUI,Make it easy and convenient for everyone to use artificial intelligence technology。让每个人都简单方便的使用前沿人工智能技术
Paper2GUI: 一款面向普通人的AI 桌面APP,免安装即开即用,已支持 40+AI 模型,内容涵盖 AI 绘画、语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR 识别等领域。支持 Windows、Mac、Linux 系统。
English | 中文 | Telegram | B站(媒体)
小白兔 AI 3.0 版起永久免费 AI 绘画、人脸动漫化,图片修复和视频补帧功能,欢迎使用
下载小白兔 AI:
已发布内容【下列独立 APP 完全免费】
文字转语音工具,适用于配音、讲解、说书、广告等场景。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
微软语音合成 🔥 | 5Mb | FastSpeech | ✅ | ✅ | ✅ | ✅ | Download |
阿里云语音合成 | 13Mb | Unknown | 🔲 | ✅ | ✅ | ✅ | Download |
文本转图片,想象力与 AI 的完美结合
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
StableDiffusion🔥 | 10Mb | Naifu | ✅ | ✅ | 🔲 | 🔲 | Download |
视频超分工具,适用于 720p 或 360p 视频转 1080p 或 4k 视频,画质升级且不模糊,目前主要用于动漫视频超分。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
RealESRGAN-GUI(RAM)🔥 | 41.8Mb | RealESRGANv3 | ✅ | ✅ | 🔲 | 🔲 | Download |
waifu2x-GUI | 38.9Mb | waifu2x | ⏳ | ✅ | 🔲 | 🔲 | Download |
RealESRGAN-GUI | 28.8Mb | RealESRGANv2 | 🔲 | ✅ | 🔲 | 🔲 | Download |
RealCugan-GUI | 56.4Mb | RealCugan | 🔲 | ✅ | 🔲 | 🔲 | Download |
RealSR-GUI | 94.5Mb | RealSR | 🔲 | ✅ | 🔲 | 🔲 | Download |
运动类视频流畅度升级工具,可以将低帧率 30fps 升级到 60fps 或 360fps。适用于丝滑质感需求。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
RIFE-GUI(RAM)🔥 | 51.2Mb | Rife | ✅ | ✅ | 🔲 | 🔲 | Download |
DAIN-GUI | 72.6Mb | Dain | 🔲 | ✅ | 🔲 | 🔲 | Download |
图像风格化,可以将照片转换为动漫风格、梵高风格、毕加索风格等等。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
AnimeGAN-GUI🔥 | 8.9Mb | AnimeGANv2 | ✅ | ✅ | 🔲 | 🔲 | Download |
AI 一键抠图,可生成透明图、绿幕、红幕、蓝幕等背景图片,头发丝处理良好,适合任意人物抠图需求。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
RVM-GUI🔥 | 12.9Mb | rvm | 🔲 | ✅ | 🔲 | 🔲 | Download |
人像修复,可以将人像修复为清晰的图片,提升清晰度。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
GFPGAN-GUI🔥 | 242Mb | GFPGAN | ✅ | ✅ | 🔲 | 🔲 | Download |
视频抠图,利用 RVM 等算法,可实现无绿幕视频抠图,适合各种自媒体视频制作,节约大量时间。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
MODNet-GUI🔥 | 77.5Mb | modnet | 🔲 | ✅ | 🔲 | 🔲 | Download |
MobileNetV2-GUI🔥 | 34.6Mb | MobileNetV2 | 🔲 | ✅ | 🔲 | 🔲 | Download |
适用范围太广,比如物体检测、口罩检测、车牌检测、车辆检测、苹果质量等级检测等等。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
YOLOv6-GUI | 46Mb | yolov6n | ✅ | ✅ | 🔲 | 🔲 | Download |
YOLOv5-GUI | 60.2Mb | yolov5s | ✅ | ✅ | 🔲 | 🔲 | Download |
YOLOX-GUI | 50Mb | yolox_nano | ✅ | ✅ | 🔲 | 🔲 | Download |
辅助工具,提供了一些常用的辅助工具,比如视频比对工具等。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
Video_compare🔥 | 56.1Mb | ✅ | 🔲 | 🔲 | Download |
小白兔 AI 是一款功能非常强大的人工智能软件,实现了 AI 绘画、语音合成、视频抠图、动漫超分辨、视频补帧、录音降噪、视频上色、人脸动漫化、图片修图、视频修复等 40 余种功能,致力于打造一款实用、好玩又有趣的 AI 生产力聚合工具箱。面向生产力用户,可免费试用 14 天,支持 Windows 和 Mac 系统。从 3.0 版起 AI 绘画、人脸动漫化、图片修复和视频补帧永久免费。
已内置功能 | 适用场景 | 功能简介 |
---|---|---|
RealCugan-Pro 动漫超分辨 | 动漫图片或视频超分辨放大 | 自研 AI 引擎驱动,可获得最高质量的动漫超分辨效果,可能是目前唯一可轻松使用 RealCugan-Pro 模型的软件 |
RealESRGAN 动漫超分辨 | 动漫图片或视频 | 推理速度快,质量比 waifu2x 好太多,常规超分辨首选 |
智能抠图 | 任意图片或视频 | 推理速度快,一键获得透明图片或绿幕视,进行二次创作 |
人像动漫化 | 仅适合头像处理 | 转换效果出众,有趣又好玩 |
语音合成 | 自媒体视频配音、有声读书等 | 效果逼近真人,发音自然、带呼吸声、支持 txt 大文件极速合成 |
录音降噪 | 真人配音后处理 | 一键去除环境和背景噪音,提升录音清晰度,效果明显 |
视频补帧 | 运动类视频流畅度升级工具 | 可获得丝滑观感,已支持 RIFE 和 IFRNET 两种 AI 模型 |
一键超补 | 同时完成超分和补帧 | 融合超分和补帧模型,一键获得超补结果 |
AI 一键跑分 | 一键查看设备 AI 性能数据 | 模拟真实推理任务,统一量化推理任务,耗时越小越好 |
图片 OCR 识别 | 图片转文字 | 基于 Paddle-OCR-v3 模型,迄今最优秀的 OCR 识别模型、效果出众 |
视频字幕 OCR 提取 | 硬字幕提取 | 使用 PP-OCR 自动识别字幕位置及文字,输出字幕文件 |
视频上色 | 老旧黑白照片或视频上色 | 适合风景类黑白视频上色,推理速度快 |
人脸修复 | 人脸照片修复 | 可增强老旧照片、修复人脸,提高清晰度 |
目标检测 | 图像检测和分割 | 展示 AI 技术在通用场景下的检测、分割、追踪等效果 |
图像修复 | 老旧照片修复 | 可全身修复,也可只修复人脸,效果出众 |
视频转动漫 | 风格迁移 | 普通视频转换为动漫画风的视频 |
Whisper 语音识别 | 支持十几种语言识别 | 一键本地生成字幕 |
字幕翻译 | 连续语境下的字幕翻译 | 告别传统单条字幕翻译,连续语境更准确,支持 28 种语言互译 |
派蒙语音合成 | 本地 tts | 约 800 多种语音,本地无限制合成 |
聚合版面向专业需求用户,付费只是为了持续产出优质 AI 应用。已开源的 20 个单独 APP 完全免费,各取所需,请勿喷我,如果项目帮到了你,不妨点个 Star。
部分截图
适配说明
本人开发环境为Windows
系统,默认会发布Windows
和Linux
版本,得益于微软Sandbox
和WSL2
,可随时测试这些环境。为了拓展和持续产出优质又实用的 AI 生产力工具,现已上架“小白兔 AI”,欢迎大家助力开发者,推动人工智能的普及化。
社群交流
QQ 群:497556961
变更日志
参考
- webview/webview
- Tencent/ncnn
- FFmpeg/FFmpeg
- wailsapp/wails
- xinntao/Real-ESRGAN
- nihui/waifu2x-ncnn-vulkan
- nihui/realcugan-ncnn-vulkan
- nihui/rife-ncnn-vulkan
- RealESRGAN
- TuSimple/naive-ui
- vitejs/vite
- Baiyuetribe/ncnn-models
from https://github.com/Baiyuetribe/paper2gui
----------------------------------------------------------
18+ 开源 AI 工具
随着人工智能 AI 技术的发展,现在也越来越多的软件采用了 AI 技术,例如之前锋哥给大家分享过的清华大学的一些 AI 工具,包括有反向辞典、文字校对、据意查句、一键生成诗词等。同时还有视频补帧、智能抠图、语音合成、人像修复、去除马赛克等流行的 AI 项目。
如果你对这些 AI 项目感兴趣的话,今天锋哥要给大家分享这个「Paper2GUI」免费的 AI 桌面 APP 工具箱,根据作者介绍已支持 18+ AI模型,内容涵盖语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR识别等领域。支持Windows、Mac、Linux系统,未来还将适配安卓和苹果设备,另外还有小程序。
AI语音合成
AI 语音合成适用于配音、讲解、说书等场景,相比传统 TTS 有着特殊优势:有呼吸声、万千音色、自然流畅、媲美真人。
目前提供了三种语音合成,分别是微软语音、火山语音、阿里云语音,操作简单、支持音效试听、支持无限多开、中文语音丰富、自带呼吸声,效果逼真。
因为是使用了第三方接口,微软语音、火山语音、阿里云语音需要一定的付费,免费的有限制,作者也提供了免费的使用,你也可以自己去申请相关的 APPID 和 Token 密钥。
AI视频补帧
目前一般来说视频的帧数在 30FPS 左右,加上拍摄视频为了节省成本,几乎大多数电影都是 24 帧拍摄的。现在 30FPS 的影片已经开始满足不了一些人的观感了,例如我们玩游戏通常需要到 60 帧才会发现画面是流畅的。所以可以借助 AI 软件来实现插帧。
AI视频补帧提供了 Dian-GUI 和 RIFE-GUI 两个版本,根据作者推荐用 RIFE-GUI 版本,无需繁琐设置,零依赖,开箱即用的一款视频补帧工具,经过智能补帧算法,可实现丝滑流畅画质。
AI视频补帧帧率方面支持选择 60、90、120、240、360,转换的时间根据你电脑的性能了,默认使用 GPU 加速处理,较高要求 4K/60FPS 如果需要多显卡支持,作者表示未来会考虑加入多显卡支持。
AI视频超分辨放大
对于一些老旧视频、电影想要转换成高分辨率在以前是靠人工逐帧修复,成本非常高,修复的时间也很长,据说每人每天可能只能修复二三十秒,修复一部电影甚至需要两三年的时间。
而现在可以用 AI 来自动超分辨率放大,支持把视频放大2倍、3倍、4倍,甚至优化画质。AI视频超分辨放大目前提供了四种超分模型,分别是 RealCugan、RealESRGAN、RealSR、waifu2x,不同算法对不同的图像效果不一样,例如动漫类的可以优先考虑用 waifu2x 。
软件使用很简单,你只需要输入文件路径,选择要放大的倍数,开始处理即可。不过对硬件要求比较高,低配置电脑耐心等待处理了。
AI图像风格化
之前很流行把自己的头像变成卡通动漫风格,通常需要自己用 PS 等软件处理,不过现在用 AI 算法也可以快速转换,目前开源算法主要用的 AnimeGAN,软件使用很简单,打开图片直接开始处理即可。
不过作者也说了,因技术限制,目前只适合矩形图片转换,照片最好要清晰。抓换后的漫画可以采用超分辨工具进行二次优化。
AI视频抠图
图片抠图没什么难度,但是手动对视频抠图就比较麻烦了,现在借助 AI 智能算法 RVM、MODNet、MobileNetV2 等可以自动抠出图片。使用也很简单,导入视频后点击开始按钮处理即可。
需要注意的是,因为是采用 GPU 加速,所以同样你需要一个给力的显卡。输出的效果支持绿幕背景,方便你导入视频编辑软件进一步合成处理。
AI人像修复
对于一些有纪念价值的老旧照片,如果损坏的话想要修复比较麻烦,现在用 AI 技术可以自动对丢失的细节进行自动绘制。据介绍,这个项目采用的是 GFPGAN 腾讯开源的人脸修复算法,它利用预先训练好的面部 GAN(中封装的丰富和多样的先验因素进行盲脸修复。
修复效果还支持给黑白的照片上色,不过如果你的照片损坏的太严重,那么修复的效果也是不太理想,只能等 AI 算法继续训练了。
AI人像抠图
AI抠图现在已经很成熟了,有非常多的在线 AI 智能抠图网站,例如比较流行的 remove.bg,识别和抠图的结果都非常不错。现在用 Paper2GUI 也可以本地人像抠图了,支持设置抠图后的背景,例如透明、绿幕。
不过目前这个模型算法的抠图效果并不太好,对于比较复杂背景图片,例如毛发,识别抠出来的效果比较一般了。
AI目标检测
AI目标检测可以识别视频/图片里面的一些东西,采用 Yolo 目标算法,支持的检测比如物体检测、口罩检测、车牌检测、车辆检测、苹果质量等级检测等等。
总结
以上这些工具都是基于开源的 AI 项目制作成 GUI 界面版本,方便大家使用了。所有依赖和模型都是内嵌的,所有打包输出的桌面APP都是可以开箱即用。
另外「Paper2GUI」项目都是独立软件,并不是整合在一起,你可以根据你的需求来选择性下载。
最后就是这个项目作者还在继续开发中,目前一些 AI 项目使用的效果未必很好,感兴趣的可以继续关注后续的更新吧。
下载地址
项目地址:
https://github.com/Baiyuetribe/paper2gui
123网盘:
https://www.123pan.com/s/c8zA-eWzN3
----------------------------------------------------------
功能强大的AI桌面APP工具箱-小白兔AI(Paper2GUI )
小白兔AI是什么
Paper2GUI中文名叫小白兔AI,一款面向普通人且功能强度大的AI桌面APP工具箱,免安装即开即用,已支持18+AI模型,内容涵盖语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR识别等领域。支持Windows、Mac、Linux系统,未来还将适配安卓和苹果设备,另外还有小程序。
文本处理
图片处理
视频处理
语音合成页面
小白兔AI – 聚合版功能
统一、全面、高效的小白兔AI,依赖强大的自研AI引擎,整合并持久优化,现已支持抠图、人像动漫化、动漫超分辨、音频降噪、语音合成、OCR识别等十余种AI功能,GPU加速推理,Inter、NVDIA、AMD全支持。
软件现已支持手动调整并发数,可根据设备显卡体质自行调整,实现GPU的最大化利用率,因此不论是笔记本低端显卡还是RTX 3090TI都能充分释放设备性能。
AI桌面APP工具箱 小白兔AI 下载地址
Windows用户:https://github.com/Baiyuetribe/paper2gui/releases/download/Published/XBT_AI_Windows.exe
Mac用户:https://github.com/Baiyuetribe/paper2gui/releases/download/Published/XBT_AI_Mac_Arm64.zip
小白兔AI(Paper2GUI )GitHub页面:https://github.com/Baiyuetribe/paper2gui
官网:https://xiaobaituai.com/
No comments:
Post a Comment