Total Pageviews

Monday 10 April 2023

语音转文字的工具

 

Whisper Notes:用OpenAI Whisper模型将语音转录成文本

- 准确率高、快速的语音转文本工具。

- 无网络,你的数据隐私是安全的。

- 支持80多种语言、语言夹杂的场景。

 你可以将它用作语音记笔记、捕捉灵感,也可以解放双手,将长长的话用语音转成文字再发给朋友,准确率远高于系统语音识别。

from https://apps.apple.com/cn/app/id6447090616?platform=iphone 

-------------------------------------

悦录 - 免费的语音转写为文字的app

 自然语言处理、声纹识别、语音识别等核心语音技术,实现了录音器械级别的语音质量,可以满足您在知识学习、采访录音、交谈对话、实时笔记等多种场景下的录音转文字需求。

悦录识别率还不错,官方号称 96% 的文本识别准确率。每天可以免费转写 3 小时,并且能在云端免费存储 200 小时的音频。支持网页 web、iOS、安卓,多端同步还不错。

http://www.voiceclub.cn

-------------------------------------

语音转文字的工具-Buzz


Buzz 是一款开源的实时语音转文字工具,基于 OpenAI Whisper 的开源音频转文字模型。多操作系统支持包括 Windows、macOS、Linux。Buzz支持麦克风语音实时转换为文字,也支持将视频、音频文件转换为文字、字幕。

功能特性:
    实时语音转文字、实时翻译(多国语言,包括中文)
    导入音频、视频文件(mp3、wav、m4a、ogg、mp4、webm、ogm),导出逐句字幕或逐词字幕(导出格式:TXT、SRT、VTT)

Buzz支持离线进行解析翻译。使用时,选择Whisper 通用语音识别模型。根据质量要求,语音识别模型的体积大小不同。最小可选择tiny模型。

源代码:https://github.com/chidiwilliams/buzz 

-------------

谷歌开源 Android语音引擎—Live Transcribe

Live Transcribe语音引擎是Google开源的 Android语音识别转录工具,可以将语音或对话实时转录为文字,也能为听障人士提供帮助。Live Transcribe 早在今年2月就已经推出,语音识别由谷歌的Cloud Speech API提供。但谷歌表示依赖于云对于网络连接、数据成本和延迟增加了复杂度和不确定性。因此,谷歌把Live Transcribe 的语音引擎开源出来,鼓励开发人员搭建服务并进一步开发和完善Live Transcribe语音引擎。Live Transcribe 语音引擎遵守Apache2.0开源协议。

Live Transcribe的自动识别语音引擎ASR( automatic speech recognition) 模块包含以下特性:

    无限流媒体。
    支持70多种语言(包含中文)
    减少网络数据丢失(在网络和Wi-Fi之间切换时)。文字不会丢失,只会延迟。
    优化扩展网络损耗。即使网络已经停电数小时,也会重新连接。
    优化减少服务器出错
    支持启用和配置Opus,AMR-WB和FLAC编码。
    包含文本格式库,用于可视化ASR置信度、发言人ID等
    可离线模型扩展
    内置支持语音检测器,可在延长静音期间用于停止ASR,以节省资金和数据。
    内置支持扬声器识别,可根据扬声器编号标记或着色文本。

[repo owner=”google” name=”live-transcribe-speech-engine”]

----------------------------

Voice Transcriber Bot

Voice Transcriber Bot是一个免费语音转文字工具/telegram机器人,支持中文、英文转文字等等10+种语言,直接发送一段语音过去,稍等一会即可识别,然后返回一段文字,非常方便的语音转文字工具。

免费语音转文字工具 支持10+种语言-Voice Transcriber Bot

地址:https://t.me/voicetranscriberobot
------

Insanely Fast Whisper-基于OpenAI模型的快速音频转文字工具

Insanely Fast Whisper是一个基于OpenAI Whisper Large v3模型的快速音频转文字工具,能够在不到98秒的时间内转录300分钟(5 小时)的音频,适用于各种不同的应用场景,例如处理长时间的会议录音、采访音频,还是其他类型的音频文件,都能高效完成,而且支持翻译功能,可以在演示站点体验。

GitHub地址:https://github.com/chenxwh/insanely-fast-whisper

演示地址:https://replicate.com/vaibhavs10/incredibly-fast-whisper

-------------

一款通过AI技术将音/视频转为文字的工具

网站名称:Accurate AI

网站功能:音视频转文字

网站简介:一款通过AI技术将音视频转文字的工具。

可准确转录采访、会议、演讲等语音内容。支持多种语言,错误率低。平均每小时音频12分钟可以交付。

网站网址:https://riverside.fm/transcription

---------------------------------------------------

AI音频视频转文本工具 播客 视频一键转录翻译-Memo AI

Memo AI是一款多功能的AI音频/视频和播客转文本工具。它可以将YouTube、播客和本地音频、视频文件转录成文字,并支持多语种之间的翻译,覆盖90多种语言。该工具还提供了诸多核心功能,包括视频转文字、多语言支持、文字翻译、漂浮注释、实时字幕、本地媒体支持、音频剪辑和AI摘要、合成新的语音等。Memo AI支持Windows和macOS桌面设备,并可以导出字幕和Markdown格式的文件。通过使用先进的AI技术,Memo AI使得视频的转录、翻译和内容摘要变得简单易行。

官网:https://memo.ac/

No comments:

Post a Comment