Whisper Notes:用OpenAI Whisper模型将语音转录成文本。
- 准确率高、快速的语音转文本工具。
- 无网络,你的数据隐私是安全的。
- 支持80多种语言、语言夹杂的场景。
你可以将它用作语音记笔记、捕捉灵感,也可以解放双手,将长长的话用语音转成文字再发给朋友,准确率远高于系统语音识别。
from https://apps.apple.com/cn/app/id6447090616?platform=iphone
-------------------------------------
悦录 - 免费的语音转写为文字的app
自然语言处理、声纹识别、语音识别等核心语音技术,实现了录音器械级别的语音质量,可以满足您在知识学习、采访录音、交谈对话、实时笔记等多种场景下的录音转文字需求。
悦录识别率还不错,官方号称 96% 的文本识别准确率。每天可以免费转写 3 小时,并且能在云端免费存储 200 小时的音频。支持网页 web、iOS、安卓,多端同步还不错。
-------------------------------------
语音转文字的工具-Buzz
Buzz 是一款开源的实时语音转文字工具,基于 OpenAI Whisper 的开源音频转文字模型。多操作系统支持包括 Windows、macOS、Linux。Buzz支持麦克风语音实时转换为文字,也支持将视频、音频文件转换为文字、字幕。
功能特性:
实时语音转文字、实时翻译(多国语言,包括中文)
导入音频、视频文件(mp3、wav、m4a、ogg、mp4、webm、ogm),导出逐句字幕或逐词字幕(导出格式:TXT、SRT、VTT)
Buzz支持离线进行解析翻译。使用时,选择Whisper 通用语音识别模型。根据质量要求,语音识别模型的体积大小不同。最小可选择tiny模型。
源代码:https://github.com/chidiwilliams/buzz
-------------
谷歌开源 Android语音引擎—Live Transcribe
Live Transcribe语音引擎是Google开源的 Android语音识别转录工具,可以将语音或对话实时转录为文字,也能为听障人士提供帮助。Live Transcribe 早在今年2月就已经推出,语音识别由谷歌的Cloud Speech API提供。但谷歌表示依赖于云对于网络连接、数据成本和延迟增加了复杂度和不确定性。因此,谷歌把Live Transcribe 的语音引擎开源出来,鼓励开发人员搭建服务并进一步开发和完善Live Transcribe语音引擎。Live Transcribe 语音引擎遵守Apache2.0开源协议。
Live Transcribe的自动识别语音引擎ASR( automatic speech recognition) 模块包含以下特性:
无限流媒体。
支持70多种语言(包含中文)
减少网络数据丢失(在网络和Wi-Fi之间切换时)。文字不会丢失,只会延迟。
优化扩展网络损耗。即使网络已经停电数小时,也会重新连接。
优化减少服务器出错
支持启用和配置Opus,AMR-WB和FLAC编码。
包含文本格式库,用于可视化ASR置信度、发言人ID等
可离线模型扩展
内置支持语音检测器,可在延长静音期间用于停止ASR,以节省资金和数据。
内置支持扬声器识别,可根据扬声器编号标记或着色文本。
[repo owner=”google” name=”live-transcribe-speech-engine”]
----------------------------
Voice Transcriber Bot
Voice Transcriber Bot是一个免费语音转文字工具/telegram机器人,支持中文、英文转文字等等10+种语言,直接发送一段语音过去,稍等一会即可识别,然后返回一段文字,非常方便的语音转文字工具。
免费语音转文字工具 支持10+种语言-Voice Transcriber Bot
地址:https://t.me/voicetranscriberobot
------
Insanely Fast Whisper-基于OpenAI模型的快速音频转文字工具
Insanely Fast Whisper是一个基于OpenAI Whisper Large v3模型的快速音频转文字工具,能够在不到98秒的时间内转录300分钟(5 小时)的音频,适用于各种不同的应用场景,例如处理长时间的会议录音、采访音频,还是其他类型的音频文件,都能高效完成,而且支持翻译功能,可以在演示站点体验。
GitHub地址:https://github.com/chenxwh/insanely-fast-whisper
演示地址:https://replicate.com/vaibhavs10/incredibly-fast-whisper
-------------
一款通过AI技术将音/视频转为文字的工具
网站名称:Accurate AI
网站功能:音视频转文字
网站简介:一款通过AI技术将音视频转文字的工具。
可准确转录采访、会议、演讲等语音内容。支持多种语言,错误率低。平均每小时音频12分钟可以交付。
网站网址:https://riverside.fm/transcription
---------------------------------------------------
AI音频视频转文本工具 播客 视频一键转录翻译-Memo AI
Memo AI是一款多功能的AI音频/视频和播客转文本工具。它可以将YouTube、播客和本地音频、视频文件转录成文字,并支持多语种之间的翻译,覆盖90多种语言。该工具还提供了诸多核心功能,包括视频转文字、多语言支持、文字翻译、漂浮注释、实时字幕、本地媒体支持、音频剪辑和AI摘要、合成新的语音等。Memo AI支持Windows和macOS桌面设备,并可以导出字幕和Markdown格式的文件。通过使用先进的AI技术,Memo AI使得视频的转录、翻译和内容摘要变得简单易行。
官网:https://memo.ac/
No comments:
Post a Comment