av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

<nobr id="nbyal"><strong id="nbyal"><label id="nbyal"></label></strong></nobr>

<big id="nbyal"><strike id="nbyal"><form id="nbyal"></form></strike></big>

微信掃一掃，關(guān)注公眾號

科技行者
算力行者

見證連接與計算的「力量」

阿里達摩院又一年：談AI的一千種可能，私人定制聲音是其中一種

AI人工智能阿里巴巴阿里巴巴達摩院語音合成

阿里達摩院又一年：談AI的一千種可能，私人定制聲音是其中一種

作者：周雅

2019-07-11 18:48

分享至：

兩年過去了，達摩院究竟在做什么？7月10日下午，阿里巴巴在北京舉辦了一場媒體溝通會，這場會的主角，是阿里巴巴達摩院機器智能技術(shù)實驗室，幾位阿里發(fā)言人講了講達摩院目前在AI領(lǐng)域的業(yè)務(wù)布局、人才儲備、以及技術(shù)演進結(jié)果。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2019-07-11 18:48 ? 周雅

科技行者 7月11日北京消息（文/周雅）：馬克思曾經(jīng)一句名言“科技是第一生產(chǎn)力”，放到互聯(lián)網(wǎng)時代依然顛撲不破，很多互聯(lián)網(wǎng)公司也深諳這一點，對于“科技創(chuàng)新”的追求從未停止過。

以阿里巴巴舉例。考慮到阿里的未來科技力量儲備，馬云在2017年建成「達摩院」，成立之初，他對達摩院提出三個要求，“活得要比阿里巴巴長”、“服務(wù)至少20億人”、“必須用科技解決未來的問題”，官方聲稱這是“一家致力于探索科技未知，以人類愿景為驅(qū)動力的研究院”。

然而兩年過去了，達摩院究竟在做什么？7月10日下午，阿里巴巴在北京舉辦了一場媒體溝通會，這場會的主角，是阿里巴巴達摩院機器智能技術(shù)實驗室，幾位阿里發(fā)言人講了講達摩院目前在AI領(lǐng)域的業(yè)務(wù)布局、人才儲備、以及技術(shù)演進結(jié)果。

不一樣的達摩院

成立達摩院時，馬云表示三年內(nèi)將投入逾1000億元，并將在初期招攬100名頂級科學家和研究人員。但他同時也提出要求，即達摩院要學會自營自利，未來要自己掙錢。

這也使得達摩院一開始就與其他的研究院有了很大不同。

達摩院機器智能技術(shù)事業(yè)部首席架構(gòu)師王駿以達摩院機器智能技術(shù)實驗室為例介紹道，整個部門的運作方式，是“研”“發(fā)”并重，既有research（研究），也有develop（開發(fā)），任務(wù)是希望開發(fā)出先進的AI技術(shù)和產(chǎn)品，達到理想中的物理實驗真正有價值的地方，不僅是商業(yè)價值，還有社會價值。

正因為學術(shù)思維和商業(yè)思維并重，該部門自然而然形成了一種自上而下的中心化研究管理體系，既確定了大的研究方向，同時保持研究自由度，任何研究小組都可以去做他感興趣的方向，并兼顧短期、中期、長期的規(guī)劃，最終的價值也都體現(xiàn)在創(chuàng)新技術(shù)產(chǎn)品上。

因此，回顧這兩年，達摩院既有一些理論性的研究，也有一些實踐性的應(yīng)用。比如，僅阿里AI團隊，便在國際頂級學術(shù)會議上共發(fā)表了近400篇頂級論文，同時也在國際頂級技術(shù)賽事上斬獲40余項世界第一，有20多個行業(yè)應(yīng)用落地，涉及交通、醫(yī)療、零售等等領(lǐng)域。

再比如，剛剛過去的6月份，在被譽為人工智能世界杯的WebVision競賽中，阿里AI擊敗了全世界150多支參賽隊伍，獲得冠軍。這是一個超大規(guī)模圖像識別的比賽，它要實現(xiàn)的是給機器一張圖，讓它去搜索其他關(guān)聯(lián)圖，這與眾所周知的“谷歌花大量時間讓機器識別一只貓”是一樣的道理，只不過這個比賽難度更大，它不允許人工標注，這就意味著要讓機器自己具備歸納海量圖片的能力。據(jù)王駿介紹，其實阿里很早就開始研究這一技術(shù)，拍立淘便是該技術(shù)的前身，目前阿里AI可以識別超過100萬種物理實體，“我們希望有一天，計算機可以自動識別每一個物體。”王駿說。

還有，2018年1月，在斯坦福大學發(fā)起的機器閱讀理解領(lǐng)域頂級賽事SQuAD上，阿里AI在開放域問答任務(wù)上達到人類水平。這是一個什么概念？我們所理解的AI問答，是基于數(shù)據(jù)庫進行回答，但實際上很多問題涉及兩點：有沒有問答數(shù)據(jù)，以及有沒有知識統(tǒng)計。比方一個簡單問題“中國首都有多少人？”就隱含兩個問題：“中國首都是哪？”以及“這個城市有多少人口？”因此，AI在這個回答過程里，先要在數(shù)據(jù)庫里找到一個多文檔排序，匹配出與問題相關(guān)的文檔，再在文檔里定位問題，并作出回答。

取得這些成績，與達摩院雄厚的人才儲備不無關(guān)系。目前，達摩院旗下的科學家團隊包括：美國密歇根州立大學終身教授金榕、密西根大學終身教授施堯耘、新加坡南洋理工大學終身教授王剛等20多位世界級科學家，以及10多名IEEE Fellow。

王駿表示，達摩院是一個全球化的機構(gòu)，半數(shù)以上成員擁有博士以上學位，辦公室分布在4個國家的8個主要城市。其打趣說道，“正因為全球化，達摩院要想所有員工一起開個會，時間很難湊，因為各地都有時差。”

達摩院加持的語音AI

據(jù)王駿介紹，達摩院機器智能技術(shù)實驗室本質(zhì)以人工智能技術(shù)為核心，這就好比人類接收外界信號主要來自于三個感官通道，即視覺、語音、語言，與之相對應(yīng)的，阿里AI的研究領(lǐng)域則是視覺智能、語音智能、語言和知識，以及決策智能。“阿里希望機器未來具有一定的人類思維數(shù)據(jù)處理能力。”

當天，達摩院首次對外展示了新一代語音合成技術(shù)——KAN-TTS（TTS，Text To Speech，即“從文本到語音”）。官方稱，KAN-TTS由達摩院機器智能實驗室自主研發(fā)，融合了目前主流的端到端TTS技術(shù)和傳統(tǒng)TTS技術(shù)，從多個方面改進了語音合成。

達摩院語音實驗室高級算法專家雷鳴介紹了語言合成技術(shù)的歷史演變。1939年，人類第一次可以由鍵盤控制產(chǎn)生聲音，經(jīng)歷過多個發(fā)展階段，直到2017年，TTS技術(shù)已經(jīng)可以提供接近真人表現(xiàn)力的合成語音，但依然有缺陷。

據(jù)雷鳴說，當前，業(yè)界商用系統(tǒng)的合成語音與原始音頻錄音的接近程度通常在85%-90%之間，這其實已經(jīng)是一個很高水平，而基于KAN-TTS技術(shù)的合成語音，則可將該數(shù)據(jù)進一步提高到97%以上。

此外，傳統(tǒng)語音合成定制需要10小時以上的數(shù)據(jù)錄制和標注，對錄音人和錄音環(huán)境要求很高。從啟動定制到最終交付，項目周期長成本高。

阿里利用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結(jié)合的方法，將語音合成定制成本降低10倍以上，周期壓縮3倍以上。也就是說，用1小時有效錄音數(shù)據(jù)和不到兩個月制作周期，就能完成一次標準TTS定制。

普通用戶定制“AI聲音”的門檻更低。只需手機錄音十分鐘，就能獲得與錄制聲音高度相似的合成語音。阿里AI做到這一點，主要基于自動數(shù)據(jù)檢查、自動標注方法和對海量用戶場景的利用。

達摩院語音實驗室對外提供了開箱即用的TTS解決方案，這主要是針對一些產(chǎn)品具有特定場景的需求。比如有些產(chǎn)品就要講一些兒童教育的故事，有些則是講富有情感的故事，針對這些，阿里TTS解決方案共有通用、客服、童聲、英文和方言5個場景的34種高品質(zhì)聲音供選擇。

達摩院語音實驗室負責人鄢志杰說，達摩院是一個技術(shù)密集型團隊，但它并不是只專注于技術(shù)的研究，同時也要把這些技術(shù)產(chǎn)品化。比如語音技術(shù)，阿里有各種各樣語音的源頭算法，這些不僅僅應(yīng)用在阿里自己的業(yè)務(wù)上，同時也能夠把這些技術(shù)放到云上，分享給合作伙伴。“可以說，阿里有什么，阿里云的客戶就能拿到什么。”

AI人工智能阿里巴巴阿里巴巴達摩院語音合成

分享至

0贊

好文章，需要你的鼓勵

周雅

Miranda

關(guān)注科技創(chuàng)新、技術(shù)投資。以文會友，左手硬核科技，右手浪漫主義。

推薦文章

音頻生成
大語言模型
多模態(tài)AI

2025-09-10 09:47

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實驗室團隊AudioStory突破性進展

騰訊ARC實驗室推出AudioStory系統(tǒng)，首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù)，通過交錯式推理生成、解耦橋接機制和漸進式訓練，能夠?qū)碗s指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異，為AI音頻創(chuàng)作開辟新方向。
視頻生成
深度學習
多模態(tài)學習

2025-09-09 13:57

Meta與特拉維夫大學聯(lián)手打造VideoJAM：讓AI生成的視頻動起來不再是奢望

Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術(shù)，通過讓AI同時學習外觀和運動信息，顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量，在多項測試中超越包括Sora在內(nèi)的商業(yè)模型，為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
多模態(tài)AI
人類價值觀對齊
數(shù)據(jù)集構(gòu)建

2025-09-09 13:56

上海AI實驗室重磅發(fā)布：讓AI看圖"說人話"的神奇訓練法，解決多模態(tài)AI與人類價值觀對齊難題

上海AI實驗室發(fā)布OmniAlign-V研究，首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準，通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法，讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平，為AI價值觀對齊提供了可行技術(shù)路徑。
人工智能
圖神經(jīng)網(wǎng)絡(luò)
天氣預報

2025-09-09 10:56

谷歌研究團隊發(fā)布超級預測模型：讓AI像天氣預報員一樣預測全球大氣變化

谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型，能夠在不到一分鐘內(nèi)完成10天全球天氣預報，準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù)，通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律，在極端天氣預測方面表現(xiàn)卓越，能耗僅為傳統(tǒng)方法的千分之一，為氣象學領(lǐng)域帶來了效率和精度的雙重突破。

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實驗室團隊AudioStory突破性進展

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實驗室團隊AudioStory突破性進展

2025-09-10 09:47

Meta與特拉維夫大學聯(lián)手打造VideoJAM：讓AI生成的視頻動起來不再是奢望

Meta與特拉維夫大學聯(lián)手打造VideoJAM：讓AI生成的視頻動起來不再是奢望

2025-09-09 13:57

上海AI實驗室重磅發(fā)布：讓AI看圖"說人話"的神奇訓練法，解決多模態(tài)AI與人類價值觀對齊難題

上海AI實驗室重磅發(fā)布：讓AI看圖"說人話"的神奇訓練法，解決多模態(tài)AI與人類價值觀對齊難題

2025-09-09 13:56

谷歌研究團隊發(fā)布超級預測模型：讓AI像天氣預報員一樣預測全球大氣變化

谷歌研究團隊發(fā)布超級預測模型：讓AI像天氣預報員一樣預測全球大氣變化

2025-09-09 10:56

周雅

主編

關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會友，左手硬核科技，右手浪漫主義。
最近文章：
- 釘釘十年，無招終于等來了AI這把“錘子”
- 對話谷歌副總裁Karen Teo：“短劇”“AI應(yīng)用”現(xiàn)象級出海，我們看到中國開發(fā)者的三種內(nèi)核

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網(wǎng)
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網(wǎng)
51CTO傳媒
投資界
科技訊
智者新時代

京ICP證15039648號京ICP備15039648號-9 京公網(wǎng)安備 11010802021500號

北京第二十六維信息技術(shù)有限公司（至頂網(wǎng)）版權(quán)所有。 | 聯(lián)絡(luò)我們

舉報電話：010-62641205　涉未成年人舉報專線：010-62641208 舉報郵箱: jubao@zhiding.cn 　網(wǎng)上有害信息舉報專區(qū)：https://www.12377.cn

<nav id="fxc6a"><menu id="fxc6a"></menu></nav>

<blockquote id="fxc6a"></blockquote>

<dfn id="fxc6a"><menu id="fxc6a"></menu></dfn>