yakitome是一個功能強大的在線轉換文本成語音(Text To Speech)的服務,支持將英語、西班牙語、法語、德語四種語言的文字以及.doc .pdf .txt .html.xml等格式的文檔轉換成mp3.wav格式。
註冊後,點擊“Free Text To Speech” 進入操作,第一步:yakitome提供四種輸入方式,你可以直接輸入文字、上傳文檔(支持.doc, .pdf, .txt )、也可以直接輸入RSS feed URI 地址、另外還可以抓取支持POP收信的email郵件內容進行轉換。第二步對輸出進行設置,包括語言、人聲、語速、文件格式(支持mp3.wav)以及更 新頻率;第三步就可以轉換了,轉換的文件可以在線試聽,也可以下載到設備上,同時通過yakitome提供的podcast功能,blogger可以很方 便地將自己的blog內容同步轉換為播客,從而提供給讀者另外一種輕松的“閱讀”方式,可惜的是不支持中文。如果國內有這方面的服務,支持將漢字轉換成語音,並能讀取RSS feed內容,實現了聽博客的功能,那一定很受歡迎的。
網絡地址:http://www.yakitome.com/
國內:
科大訊飛在線文本轉語音
◆ 多語種服務
創新的多語種統一語音合成服務架構,基於同一個引擎,集成中英粵三種語言,支持純英文發音。用戶根據自身業務的要求可選擇普通話、東北話、四川話、臺灣話、湖南話、陜西話、河南話等豐富語言的地方語言,主流語種還可實現與英語的同音混讀,充分滿足多個性化語言語音信息服務需求。
◆ 多音色服務
提供風格多樣化的音色選擇,如渾厚淳正的男聲,成熟穩重、輕快活潑、或溫柔甜美的女聲,以及童聲,中年男聲、青年女聲,老年男聲等等,並秉承科大訊飛語音技術一貫的最高質量效果表現。豐富的音庫使客戶能夠結合業務特點,選擇最適合業務需要的音色,並可在實際應用中,實時進行音庫切換。
◆ 高精度文本分析技術
ViviVoice 語音合成軟件應用高準確度智能文本分析與預處理技術,有效保障最終合成語音準確、清晰、流暢。得益於科大訊飛在語言學研究和實踐上的深厚積累,通過與中國社會科學院語言所等相關權威科研機構的緊密合作,以及基於寬廣的應用實踐平臺所積累的海量專業知識庫,經過不斷訓練和優化,即使在面對針對語言分析處理的難點,如多音字、特殊符號、韻律短語、未登錄詞(如地名、人名)等等,也能保障得到高度準確的自動處理結果。
◆ 高表現力的合成引擎
支持疑問和感嘆語氣,支持高興和悲傷情感,充分體現產品的個性化和娛樂功能的特點。
◆ 強大的調節設置能力
在ViviVoice產品中提供了豐富完善的參數設置與調節功能和工具,幫助用戶對語音合成效果進行靈活高效的控制與管理。提供對全局參數(如音量、語速、音高等)、用戶詞典、用戶規則、定制資源包統一進行配置和管理的工具;數字、標點符號、英文發音方式的設定;中英文加詞功能,可以指定每個字詞的拼音或音標等等;提供統一的簡單易用圖形化用戶界面進行操作設定。
◆ 完善的效果優化方案
提供以定制資源包(加載於合成引擎之上,有效提升既定應用領域語音效果的資源集合)和CSSML和虛擬不定長工具為代表的主流應用環境進行效果優化的高效解決方案,顯著提升實際應用效果。科大訊飛專業服務體系提供高效的定制與優化方案,提升客戶體驗,幫助客戶獲得語音自助服務的持續成功。
◆ 合理的體系結構
ViviVoice采用基於TCP/IP的高效網絡語音合成服務和集中式的資源管理機制,形成客戶端-資源管理器-服務器有機結合的體系架構,構建可靈活伸縮的方案,科大訊飛這一業界領先的體系架構,其高可用性歷經眾多重點行業大規模關鍵業務的應用檢驗,確保提供值得信賴的7×24小時不間斷自動化語音服務。
◆ 背景音和預錄音
ViviVoice 采用了科大訊飛業界首創的預錄音統一管理功能和背景音功能,進一步提升用戶體驗。
預錄音管理能力允許客戶將預先錄制的語音作為語音合成系統的資源,並通過提示音智能匹配和合成模板等方式使預錄音與合成音匹配更加容易、銜接更加流暢,同時避免頻繁處理提示音播放與語音合成的切換與過渡問題,簡化應用流程的復雜程度,進一步提高服務效果與質量。
背景音功能,通過系統提供的簡單易用工具,可以便捷高效的添加背景音樂,調整背景音樂和合成語音的音量對比,並可直接試聽實際效果,使語音服務更加親切自然。
◆ 多字符集支持
支持輸入GB2312、GBK、Big5、Unicode和UTF-8等多種字符集,普通文本和帶有CSSML標註等多種格式的文本信息。
◆ 靈活的接口
提供了預錄音、背景音、COM、語音資源管理等接口,便於客戶根據自身需要進行靈活選擇。
網絡地址:http://www.iflytek.com/TtsDemo/viviVoiceShow.aspx
註冊後,點擊“Free Text To Speech” 進入操作,第一步:yakitome提供四種輸入方式,你可以直接輸入文字、上傳文檔(支持.doc, .pdf, .txt )、也可以直接輸入RSS feed URI 地址、另外還可以抓取支持POP收信的email郵件內容進行轉換。第二步對輸出進行設置,包括語言、人聲、語速、文件格式(支持mp3.wav)以及更 新頻率;第三步就可以轉換了,轉換的文件可以在線試聽,也可以下載到設備上,同時通過yakitome提供的podcast功能,blogger可以很方 便地將自己的blog內容同步轉換為播客,從而提供給讀者另外一種輕松的“閱讀”方式,可惜的是不支持中文。如果國內有這方面的服務,支持將漢字轉換成語音,並能讀取RSS feed內容,實現了聽博客的功能,那一定很受歡迎的。
網絡地址:http://www.yakitome.com/
國內:
科大訊飛在線文本轉語音
◆ 多語種服務
創新的多語種統一語音合成服務架構,基於同一個引擎,集成中英粵三種語言,支持純英文發音。用戶根據自身業務的要求可選擇普通話、東北話、四川話、臺灣話、湖南話、陜西話、河南話等豐富語言的地方語言,主流語種還可實現與英語的同音混讀,充分滿足多個性化語言語音信息服務需求。
◆ 多音色服務
提供風格多樣化的音色選擇,如渾厚淳正的男聲,成熟穩重、輕快活潑、或溫柔甜美的女聲,以及童聲,中年男聲、青年女聲,老年男聲等等,並秉承科大訊飛語音技術一貫的最高質量效果表現。豐富的音庫使客戶能夠結合業務特點,選擇最適合業務需要的音色,並可在實際應用中,實時進行音庫切換。
◆ 高精度文本分析技術
ViviVoice 語音合成軟件應用高準確度智能文本分析與預處理技術,有效保障最終合成語音準確、清晰、流暢。得益於科大訊飛在語言學研究和實踐上的深厚積累,通過與中國社會科學院語言所等相關權威科研機構的緊密合作,以及基於寬廣的應用實踐平臺所積累的海量專業知識庫,經過不斷訓練和優化,即使在面對針對語言分析處理的難點,如多音字、特殊符號、韻律短語、未登錄詞(如地名、人名)等等,也能保障得到高度準確的自動處理結果。
◆ 高表現力的合成引擎
支持疑問和感嘆語氣,支持高興和悲傷情感,充分體現產品的個性化和娛樂功能的特點。
◆ 強大的調節設置能力
在ViviVoice產品中提供了豐富完善的參數設置與調節功能和工具,幫助用戶對語音合成效果進行靈活高效的控制與管理。提供對全局參數(如音量、語速、音高等)、用戶詞典、用戶規則、定制資源包統一進行配置和管理的工具;數字、標點符號、英文發音方式的設定;中英文加詞功能,可以指定每個字詞的拼音或音標等等;提供統一的簡單易用圖形化用戶界面進行操作設定。
◆ 完善的效果優化方案
提供以定制資源包(加載於合成引擎之上,有效提升既定應用領域語音效果的資源集合)和CSSML和虛擬不定長工具為代表的主流應用環境進行效果優化的高效解決方案,顯著提升實際應用效果。科大訊飛專業服務體系提供高效的定制與優化方案,提升客戶體驗,幫助客戶獲得語音自助服務的持續成功。
◆ 合理的體系結構
ViviVoice采用基於TCP/IP的高效網絡語音合成服務和集中式的資源管理機制,形成客戶端-資源管理器-服務器有機結合的體系架構,構建可靈活伸縮的方案,科大訊飛這一業界領先的體系架構,其高可用性歷經眾多重點行業大規模關鍵業務的應用檢驗,確保提供值得信賴的7×24小時不間斷自動化語音服務。
◆ 背景音和預錄音
ViviVoice 采用了科大訊飛業界首創的預錄音統一管理功能和背景音功能,進一步提升用戶體驗。
預錄音管理能力允許客戶將預先錄制的語音作為語音合成系統的資源,並通過提示音智能匹配和合成模板等方式使預錄音與合成音匹配更加容易、銜接更加流暢,同時避免頻繁處理提示音播放與語音合成的切換與過渡問題,簡化應用流程的復雜程度,進一步提高服務效果與質量。
背景音功能,通過系統提供的簡單易用工具,可以便捷高效的添加背景音樂,調整背景音樂和合成語音的音量對比,並可直接試聽實際效果,使語音服務更加親切自然。
◆ 多字符集支持
支持輸入GB2312、GBK、Big5、Unicode和UTF-8等多種字符集,普通文本和帶有CSSML標註等多種格式的文本信息。
◆ 靈活的接口
提供了預錄音、背景音、COM、語音資源管理等接口,便於客戶根據自身需要進行靈活選擇。
網絡地址:http://www.iflytek.com/TtsDemo/viviVoiceShow.aspx