av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃,關(guān)注公眾號

  • 科技行者

  • 算力行者

見證連接與計算的「力量」

首頁 阿里公布新語音合成技術(shù) 錄音10分鐘定制AI語音

阿里公布新語音合成技術(shù) 錄音10分鐘定制AI語音

2019-07-10 18:23
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2019-07-10 18:23 ? 科技行者

科技行者 7月10日 北京消息:近日,阿里發(fā)布新一代語音合成技術(shù)KAN-TTS,大幅提高合成語音與真人發(fā)聲的相似度,并將語音合成定制成本降低10倍以上。

阿里AI的這項突破,將問世80年的語音合成(TTS)技術(shù)推向幾可亂真的水平,有望通過圖靈測試。

當(dāng)前業(yè)界商用系統(tǒng)的合成語音與原始音頻錄音的接近程度通常在85%90%之間,而基于KAN-TTS技術(shù)的合成語音可將該數(shù)據(jù)提高到97%以上。

KAN-TTS由達摩院機器智能實驗室自主研發(fā),深度融合了目前主流的端到端TTS技術(shù)和傳統(tǒng)TTS技術(shù),從多個方面改進了語音合成。

傳統(tǒng)語音合成定制需要10小時以上的數(shù)據(jù)錄制和標(biāo)注,對錄音人和錄音環(huán)境要求很高。從啟動定制到最終交付,項目周期長成本高。

阿里利用Multi-Speaker ModelSpeaker-aware Advanced Transfer Learning相結(jié)合的方法,將語音合成定制成本降低10倍以上,周期壓縮3倍以上。也就是說,用1小時有效錄音數(shù)據(jù)和不到兩個月制作周期,就能完成一次標(biāo)準(zhǔn)TTS定制。

普通用戶定制“AI聲音”的門檻更低。只需手機錄音十分鐘,就能獲得與錄制聲音高度相似的合成語音。阿里AI做到這一點,主要基于自動數(shù)據(jù)檢查、自動標(biāo)注方法和對海量用戶場景的利用。

阿里已經(jīng)對外提供開箱即用的TTS解決方案,共有通用、客服、童聲、英文和方言5個場景的34種高品質(zhì)聲音供選擇。

基于新一代技術(shù),阿里還顯著提高了設(shè)備端離線TTS的效果。這在超低資源設(shè)備端的TTS服務(wù)中非常有用,比如當(dāng)人們駕車行駛于信號微弱區(qū)域,阿里技術(shù)能避免語音導(dǎo)航“掉線”。

分享至
0贊

好文章,需要你的鼓勵

推薦文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-