Total Pageviews

Wednesday, 22 March 2023

edge-TTS-record

 (相关帖子:https://briteming.blogspot.com/2023/04/tortoise-tts.html)

microsoftspeech 是一个基于 edge 大声朗读制作的网页版,可播放可下载。

在易用性上网页版优先级是大于脚本和软件的。

Azure Speech Download 是一个油猴脚本,来自 @小众软件 为微软官方提供的文字转语音服务添加一个下载按钮。

油猴脚本

微软官方提供的文字转语音网页 demo(下拉到网页中部)安装脚本后,打开下方网页将会出现下载按钮,如果没有刷新网页

https://azure.microsoft.com/zh-cn/services/cognitive-services/text-to-speech/

下载

下载链接来自 @系统迷

使用方法:安装后首次启动,先点左上角 “设置 TTS”。将默认首选语音引擎,改为新添加的 TTS,重新回到软件主界面。接下来,开启电池优化允许后台运行、自定义、自动重连这三个选项。

edge-TTS-record, 一个可以录制 Microsoft Edge 浏览器的语音合成(TTS)语音并输出为 .wav 音频的(windows 平台)工具

下载

用法:

下载 edge-TTS-record.exe,运行并允许联网
在文本编辑框中输入文本,调整参数,点击试听
没问题就可以点击录制了,音频文件会保存在指定的目录下

注意:

需要电脑中已安装 Microsoft Edge 浏览器,如果系统中没有安装,程序将自动为你下载安装
不管是试听还是录制,使用在线(Online)语音都需确保电脑是联网的
录制是全局的,应避免其他软件声音的干扰
在线(Online)语音似乎无法调整音调

Read Aloud 把 Edge 朗读,跟录制工具集成在了一起的 Windows 软件。

Edge 浏览器的大声朗读功能很好用,但不支持音频导出。虽然可利用录屏或录音的方式获得音频文件,但这样太麻烦。

下载

备用下载

https://www.aliyundrive.com/s/Gs9MNiUfy78

首次启动如显示 No data available,重启软件即可。

接下来,你可以把文字复制粘贴到输入框内,软件支持切换其他语音风格。默认使用 Microsoft Xiaoxiao

点击朗读按钮,Read Aloud 会开始朗读,可在线预览收听语音效果。点击录制按钮,它会边播边录制音频,然后把文件保存到文件夹。软件默认录制时长最多为 30 分钟,也可以手动增加时长。

Edge-TTS-record 工具
这是一个开源的文本转语音的工具,该工具并非直接使用微软云服务的接口,而是录制Edge 浏览器的语音合成,并将其输出为.wav格式的音频文件。

虽然原理不同,但声音都是一样,使用方法也是一样的,输入文字,点击试听/录制。

-------------------------------

EDGE浏览器的朗读功能

微软EDGE浏览器自带的朗读功能也是用的微软的TTS语音合成,我们在浏览器中随便选中一段文字,右键,朗读所选内容。

 该方式也支持选择多种语音和调整语速,如果你想将语音保存下载可以找个录制软件将声音录制下来。

我们可以将我们需要转换的文字存放在.txt文档中,然后将文档拖拽到edge浏览器中打开,这样我们就可以使用edge浏览器自带的朗读功能,来朗读任意文字。

 ---------------------------------------

分享过一款微软tts语音引擎软件。该软件调用微软文字转语音接口,发音真实自然,非常适合用来听小说。特别是微软晓晓、云希等声音效果,简直已经达到AI语音天花板。

然而可惜的是,它只能在线使用,需要一直联网,有点浪费流量。而且网络情况不太好,经常抽风,有时用着用着就卡住没声了,很难受。所以这次,小编打算推荐一款离线tts语音引擎语音包,MultiTTS

它是由网友双子T369开发的,并且一直在更新,添加各种功能。软件不需要联网,支持离线阅读,完美解决了微软tts的卡顿抽风问题。最重要的是,里面的AI语音同样接近真人发音,完全能跟微软晓晓媲美.

下载地址:https://www.123pan.com/s/BP5A-SM1xh.html (是一款安卓程序) 

-------------

MultiTTS 离线语音

首先安装 apk,然后下载离线语音包 voice,在 app 中导入数据(导入过程不要退出 app,等待片刻)。该引擎可用于安卓阅读等支持本地 tts 的 app.

------------------------------------------------------------------

TTS-Vue

微软语音合成工具,使用 Electron + Vue + ElementPlus + Vite 构建

使用指南, 博客主页

from https://tts-doc.loker.vip/home.html

(TTS-Vue 是一个开源的微软语音合成项目,采用微软官方语音合成接口,使用WebSocket链接。同时还支持edge朗读,两种接口!(Windows / macos)

支持SSML语音合成标记语言. SSML 是一种基于 XML 的标记语言,可让开发人员指定如何使用文本转语音,把输入的文本转换为合成语音。支持批量转换、支持大文件/长文本切片、支持声音试听.

项目官网https://tts-doc.loker.vip/home.html

------------------------------------------------------------

OpenAI Text-To-Speech

OpenAI TTS New(OpenAI Text-To-Speech API with Gradio)是一个体验OpenAI新版文字转语音在线生成工具,不过需要自备OpenAI API Key,目前支持7种声音和两种模型,文字转语音工具支持调节语速,而且支持下载文字转语音后的mp3格式的文件,感兴趣的同学可以到网站学习体验。

OpenAI TTS New 文字转语音在线生成工具-OpenAI Text-To-Speech API with Gradio

地址:https://huggingface.co/spaces/ysharma/OpenAI_TTS_New

----------

邀你体验微软最新AI语音合成,效果炸裂

微软Azure新增9款逼真AI语音,包括中文等多种语言。合成的语音不仅有情绪,还有自然的停顿和语气变化

中文合成语音试听

以下从微软博客复制出来的文本和音频链接

但我现在对这个职业的热爱还是非常的,呵呵,非常的,嗯,怎么说呢?日月可鉴的,哈哈,嗯还是希望可以把这个职业做下去或者做这个声音相关领域的工作,嗯,就是把自己的优势发挥的大一点,尽可能能用到自己擅长的东西,而不是说为了工作,为了挣钱而工作。

https://ttspublic.blob.core.windows.net/nickzhao/conversation.wav

我们需要加的是生抽、老抽、料酒、白糖还有一点点的醋、盐,然后把它翻炒均匀就可以了。接下来就是收汁的阶段了哈,我们加入适量的水淀粉翻炒到这个鸡丁上色,而且汤汁呢,稍稍已经比较浓稠,啊不会轻易的滑落。

https://nerualttswaves.blob.core.windows.net/nttssamples2024/XiaoxiaoML_recipe.wav

体验

微软Azure账号注册有一定门槛,为了方便用户简单上手体验,用小程序套壳做了微软的这个语音合成

体验方式:

  • 微信搜索小程序【七彩工具箱】,点击底部"微软语音"
  • 或微信内点击链接 #小程序://七彩工具箱/yox3tTy2XGHkA6m

---------------------------------------------------------------------------------

10个文本转语音的应用程序

 

有大量的文本到语音 (TTS) 系统提供商,这让您很难根据您的要求选择最好的工具。这就是为什么我编制了这份最佳文本到语音应用程序列表来指导您的原因。此列表包含付费和免费应用程序

自然读者

NaturalReader 是一款易于使用的文本转语音软件,可以处理各种文本文件。它以 10 多种语言提供 100 多种高度准确且听起来自然的语音。有趣的是,您还可以直接从Dropbox、Google Drive 和 OneDrive 等云存储平台上传文本文件。

它支持大多数文档格式,如 PDF、TXT、DOCX、PPTX、ODS、ODT 和非 DRM EPUB。NaturalReader 有三个版本:在线版、软件版和商业版,在线高级版起价为 9.99 美元/月,商业版单版起价为每位用户每月 49 美元,每位额外用户每月 10 美元。

优点
  • 由于 OCR,支持大多数文档格式,例如 PDF、TXT、DOCX、PPTX、ODS、ODT 和非 DRM EPUB 以及 JPEG 和 PNG。
  • OCR 用于从扫描文档中提取文本(仅限高级版)。
  • 支持纠正或改善任何单词的发音。
缺点
  • 提供免费版本,但需要为额外的声音进行昂贵的升级。
  • 免费应用程序仅供在线使用,即它们需要互联网连接。

Linguatec 语音阅读器

Linguatec Voice Reader 是市场上最好的文本转语音工具之一,可以轻松地将文本文件转换为音频流。它最有趣的功能是一组 60 多种听起来非常自然的高质量声音您可以选择这些专业声音中的任何一种将您的文本转换为音频。

Linguatec 提供高精度转录解决方案,这要归功于其四种产品:Voice Reader Home、Voice Reader Studio、Voice Reader Server 和 Voice Reader Web。它的家庭版每个声音售价 49 欧元(约合 59 美元),这似乎非常昂贵——尤其是与 NaturalReader 相比时。

优点
  • Studio 版每种语言售价 499 欧元(约合 605 美元),对于无限的商业用途来说,这似乎是一个非常合理的价格。
  • 支持转换大量文本格式,包括TXT、RTF、DOCX、DOC、HTM、HTML、MHT、EPUB、PDF、ODT。
  • 支持多达45 种不同的语言,包括所有广泛流行的语言,如阿拉伯语、丹麦语、荷兰语、英语、法语、德语、印地语、意大利语、日语、普通话、俄语、西班牙语、瑞典语、土耳其语等。
缺点
  • 与 NaturalReader 不同,没有免费的个人版本。
  • 在 Voice Reader Home 中仅提供一种语言和一种声音。

卡普蒂

Capti 是一个生产力强国,包括一个文本到语音引擎,可以在线和离线工作。它提供20 多种语言的自然听觉体验,并与 Dropbox、Google Drive 和 OneDrive 等云平台集成,让您可以直接从这些平台上传文件。

Capti Voice——它为教育工作者提供的解决方案——是一个识字和学习平台。作为一名教育工作者,Capti Voice 可让您通过个性化的学习和教学策略帮助学生克服语言障碍Capti Voice 可以讲述各种各样的文本文档,例如文章、电子书和网页。

优点
  • 支持多种平台,例如 Windows、macOS、iOS 和 Chrome OS。
  • 具有从网页中提取文章的功能,同时跳过所有混乱。
  • 支持多种文本格式,包括 PDF、DOCX、PPTX、EPUB、ODT、FODT、TXT、RTF、JPEG、PNG 以及 Google 文档、幻灯片和表格。
缺点
  • 免费帐户是有限的,但它仍然适用于个人(有限)。
  • 个人使用专业版和课堂使用没有可用的定价信息。

语音梦想读者

Voice Dream Reader 是一款令人印象深刻的文本到语音应用程序,可提供高质量的阅读和聆听体验它提供 30 多种语言的 200 多种语音(超过上述应用程序),并具有同步文本突出显示、自动滚动和无干扰视图,可帮助您集中注意力并更好地理解或学习内容。

优点
  • 支持多种语言,如荷兰语、英语、法语、德语、意大利语、日语、普通话、俄语、西班牙语等。
  • 上述工具的更便宜替代品在 Google Play 商店(适用于 Android)上售价 7.99 美元,在 App Store(适用于 iOS)上售价 14.99 美元。
  • 支持各种格式,如 PDF、EPUB、TXT、RTF、DOCX 和 HTML。
缺点
  • 免费版非常有限,但支持购买高级语音。
  • 与上述工具不同,不支持 Windows 和 macOS 等桌面操作系统。

阅读演讲者

ReadSpeaker 为网站、移动应用程序、嵌入式设备等提供一系列在线和离线文本转语音解决方案。令人惊讶的是,它使用50 多种语言的 200 多种声音和 90 多种自有品牌的优质声音。ReadSpeaker 提供了许多解决方案,因此我将重点介绍其通用解决方案。

优点
  • 支持多种语言,如阿拉伯语、粤语、普通话、荷兰语、英语、法语、德语、印地语、意大利语、日语、俄语、西班牙语等。
  • 与其他列出的解决方案不同, speechCloud API提供了 TTS API。
缺点
  • 与此列表中的大多数解决方案不同,没有可用的免费版本。
  • 其任何解决方案都没有定价信息(需要联系)。

语音中心

Speech Central 是一个极好的文本到语音解决方案,让您可以收听您最喜爱的电子书、博客或网页。此应用专为阅读障碍等残障用户设计它还提供稍后收听文章、检查您的收听/阅读历史记录以及执行方便任务的功能。

优点
  • 允许收听任何有助于多任务处理的网页或电子书。
  • Windows 应用程序还允许您将文本转换为音频(MP3)。
  • 高度可定制的听力和阅读体验。
缺点
  • 不支持 macOS,但支持 Android、iOS 和 Windows。
  • Windows没有免费试用版,Android 版有免费试用版。

KNFB阅读器

KNFB 阅读器是一个易于使用的文本到语音转换器。它专为视力低下、阅读障碍等残障人士打造。您可以对任何文字拍照,KNFB Reader 会大声朗读。与其他一些阅读器不同,它使用精湛的图像处理技术来捕捉准确的图片。

优点
  • 提供多种语言的语音,包括英语、法语、德语、意大利语、葡萄牙语、西班牙语、瑞典语、丹麦语、俄语等。
  • 离线工作,即不需要互联网连接。
  • 与大多数其他应用程序不同,支持将文本转换为盲文。
缺点
  • 不支持 macOS,但支持 Android、iOS 和 Windows。
  • 非常昂贵——尤其是与 Speech Central 相比(几乎是 7-8 倍)。

文字转语音!

文字转语音!一款适用于 iPhone 和 iPad 的文字转语音应用程序它从输入文本中产生听起来自然准确的声音。它可以在您输入文本时产生音频,但不支持说出完整的文本文件。此应用程序还提供 30 多种语言的 90 多种声音和自定义选项。

优点
  • 支持最流行的语言,包括英语、中文、丹麦语、法语、德语、印地语、意大利语、西班牙语、瑞典语、俄语等。
  • 离线工作,即没有互联网连接,如 KNFB 阅读器。
缺点
  • 与此列表中的各种解决方案不同,它的声音听起来不太自然
  • 与其他不同,不支持朗读文本文件或图片中的文本。

Panopreter 基础款

Panopreter Basic 是一个简单的文本到语音转换器它使用 Windows 中提供的 Microsoft TTS 语音将文本转换为音频格式,如 WAV、MP3、OGG 和 FLAC 格式。虽然基本版本非常有限,但其高级版本允许您自定义文本布局、音频音高和音量。

优点
  • 它的基本版本是免费软件,与此列表中的几乎所有工具不同。
缺点
  • 仅支持 Windows,与此处列出的大多数其他解决方案不同。
  • 基本版本非常有限——缺少所有自定义选项。
  • 基础版不支持DOCX,但可以复制粘贴内容。

语音

iSpeech 是另一种面向开发人员的文本到语音语音合成软件。它可以帮助您像此列表中的所有其他应用程序一样将文本转换为音频。其有趣的功能是它的 API 和 SDK,这使得iSpeech 与其他解决方案不同,更适合开发人员而不是最终用户。

优点
  • 用于转换或收听音频文档的在线应用程序。
  • 转换为各种音频格式,如 WAV、MP3、WMA 等。
缺点
  • 与此列表中的许多解决方案不同,它的声音听起来有点机械化
  • 没有可用的免费计划——需要购买积分才能使用其应用程序。
  • 与 Speech Central 等不同,没有并排阅读体验。

这就是市场上最好的文本转语音解决方案。这里有一些免费选项,如 NaturalReader、Capti 等,但大多数其他选项仅作为付费产品提供。

 

 

 

 

 

No comments:

Post a Comment