Whisper Notes：用OpenAI Whisper模型将语音转录成文本。

- 准确率高、快速的语音转文本工具。

- 无网络，你的数据隐私是安全的。

- 支持80多种语言、语言夹杂的场景。

你可以将它用作语音记笔记、捕捉灵感，也可以解放双手，将长长的话用语音转成文字再发给朋友，准确率远高于系统语音识别。

from https://apps.apple.com/cn/app/id6447090616?platform=iphone

-------------------------------------

悦录 - 免费的语音转写为文字的app

自然语言处理、声纹识别、语音识别等核心语音技术，实现了录音器械级别的语音质量，可以满足您在知识学习、采访录音、交谈对话、实时笔记等多种场景下的录音转文字需求。

悦录识别率还不错，官方号称 96% 的文本识别准确率。每天可以免费转写 3 小时，并且能在云端免费存储 200 小时的音频。支持网页 web、iOS、安卓，多端同步还不错。

http://www.voiceclub.cn

-------------------------------------

语音转文字的工具-Buzz

Buzz 是一款开源的实时语音转文字工具，基于 OpenAI Whisper 的开源音频转文字模型。多操作系统支持包括 Windows、macOS、Linux。Buzz支持麦克风语音实时转换为文字，也支持将视频、音频文件转换为文字、字幕。

功能特性：
实时语音转文字、实时翻译（多国语言，包括中文）
导入音频、视频文件（mp3、wav、m4a、ogg、mp4、webm、ogm），导出逐句字幕或逐词字幕（导出格式：TXT、SRT、VTT）

Buzz支持离线进行解析翻译。使用时，选择Whisper 通用语音识别模型。根据质量要求，语音识别模型的体积大小不同。最小可选择tiny模型。

源代码：https://github.com/chidiwilliams/buzz

-------------

谷歌开源 Android语音引擎—Live Transcribe

Live Transcribe语音引擎是Google开源的 Android语音识别转录工具，可以将语音或对话实时转录为文字，也能为听障人士提供帮助。Live Transcribe 早在今年2月就已经推出，语音识别由谷歌的Cloud Speech API提供。但谷歌表示依赖于云对于网络连接、数据成本和延迟增加了复杂度和不确定性。因此，谷歌把Live Transcribe 的语音引擎开源出来，鼓励开发人员搭建服务并进一步开发和完善Live Transcribe语音引擎。Live Transcribe 语音引擎遵守Apache2.0开源协议。

Live Transcribe的自动识别语音引擎ASR( automatic speech recognition) 模块包含以下特性：

    无限流媒体。
    支持70多种语言（包含中文）
    减少网络数据丢失（在网络和Wi-Fi之间切换时）。文字不会丢失，只会延迟。
    优化扩展网络损耗。即使网络已经停电数小时，也会重新连接。
    优化减少服务器出错
    支持启用和配置Opus，AMR-WB和FLAC编码。
    包含文本格式库，用于可视化ASR置信度、发言人ID等
    可离线模型扩展
    内置支持语音检测器，可在延长静音期间用于停止ASR，以节省资金和数据。
    内置支持扬声器识别，可根据扬声器编号标记或着色文本。

[repo owner=”google” name=”live-transcribe-speech-engine”]

----------------------------

Voice Transcriber Bot

Voice Transcriber Bot是一个免费语音转文字工具/telegram机器人，支持中文、英文转文字等等10+种语言，直接发送一段语音过去，稍等一会即可识别，然后返回一段文字，非常方便的语音转文字工具。

免费语音转文字工具支持10+种语言-Voice Transcriber Bot

地址：https://t.me/voicetranscriberobot
------

Insanely Fast Whisper-基于OpenAI模型的快速音频转文字工具

Insanely Fast Whisper是一个基于OpenAI Whisper Large v3模型的快速音频转文字工具，能够在不到98秒的时间内转录300分钟（5 小时）的音频，适用于各种不同的应用场景，例如处理长时间的会议录音、采访音频，还是其他类型的音频文件，都能高效完成，而且支持翻译功能，可以在演示站点体验。

GitHub地址：https://github.com/chenxwh/insanely-fast-whisper

演示地址：https://replicate.com/vaibhavs10/incredibly-fast-whisper

-------------

一款通过AI技术将音/视频转为文字的工具

网站名称：Accurate AI

网站功能：音视频转文字

网站简介：一款通过AI技术将音视频转文字的工具。

可准确转录采访、会议、演讲等语音内容。支持多种语言,错误率低。平均每小时音频12分钟可以交付。

网站网址：https://riverside.fm/transcription

---------------------------------------------------

AI音频视频转文本工具播客视频一键转录翻译-Memo AI

Memo AI是一款多功能的AI音频/视频和播客转文本工具。它可以将YouTube、播客和本地音频、视频文件转录成文字，并支持多语种之间的翻译，覆盖90多种语言。该工具还提供了诸多核心功能，包括视频转文字、多语言支持、文字翻译、漂浮注释、实时字幕、本地媒体支持、音频剪辑和AI摘要、合成新的语音等。Memo AI支持Windows和macOS桌面设备，并可以导出字幕和Markdown格式的文件。通过使用先进的AI技术，Memo AI使得视频的转录、翻译和内容摘要变得简单易行。

官网：https://memo.ac/

------------------------------------

i笛云听写 - 免费语音转文字

经常有小伙伴询问语音转文字的软件，大多数都是需要付费的，今天锋哥给大家分享「i笛云听写」一款在线的语音转文字软件免费版，同时还拥有安卓、iOS的应用，支持音频数据同步。

网站地址：
http://www.voiceclub.cn/#/home/transaudio

目前注册用户提供了每天 10 小时的语音转文字额度，单音频时长可达 3 小时，文件体积最大 500 MB。对于普通用户来说其实够用了，如果实在不够用，可以多注册几个账号，或者对音频文件进行切割。

--------------------

[WIN] TMSpeech - 免费实时语音转字幕软件

一款中文实时语音字幕软件「TMSpeech」捕获电脑声音（录内音），将语音实时转文字，并以唱词字幕的形式展示。默认会将识别结果按日期保存到“我的文档”的文件夹中 TMSpeechLogs。最新版本可以支持自行安装模型了。

功能介绍

语音实时转文字，并以唱词字幕的形式展示。

可以用于实时字幕同步显示，支持中文或英文。

也可以用于直播，人物讲话文字实时显示。

更多使用方式可以根据实际情况使用。

下载地址

网盘下载：

https://pan.quark.cn/s/ea1969101f90

( TMSpeech 实时字幕，会议语音识别工具

TMSpeech 是一个Windows下的中文实时语音字幕，通过WASAPI的CaptureLoopback捕获电脑声音（录内音），将语音实时转文字，并以歌词字幕的形式展示。即使完全关闭电脑声音也能使用。

https://github.com/jxlpzqc/TMSpeech )

----------------------------------------------------

视频批量翻译添加字幕工具

https://github.com/buxuku/video-subtitle-master

前往 release 页面根据自己的操作系统下载安装包

安装并运行程序

在程序中配置所需的翻译服务

选择要处理的视频文件或字幕文件

设置相关参数（如源语言、目标语言、模型等）

看得透又看得远者prevail. ppt.cc/flUmLx ppt.cc/fqtgqx ppt.cc/fZsXUx ppt.cc/fhWnZx ppt.cc/fnrkVx ppt.cc/f2CBVx

Pages

Monday, 10 April 2023

语音转文字的工具

悦录 - 免费的语音转写为文字的app

自然语言处理、声纹识别、语音识别等核心语音技术，实现了录音器械级别的语音质量，可以满足您在知识学习、采访录音、交谈对话、实时笔记等多种场景下的录音转文字需求。

No comments:

Post a Comment