CNET科技資訊網(wǎng) 8月24日 北京消息(文/齊豐潤):人工智能,一個(gè)對(duì)于普通大眾來說即有所耳聞,卻又頗感陌生的詞語。一個(gè)充斥在我們身邊,卻又很難觸及到的東西。
現(xiàn)實(shí)中,諸如深藍(lán)、AlphaGo等名聲大震的人工智能都讓人們有所耳聞。而對(duì)于普通人來說,人工智能又應(yīng)當(dāng)以什么姿態(tài)出現(xiàn)在他們面前呢?在“小冰AI有信”的戰(zhàn)略合作發(fā)布會(huì)上,來自有信和微軟小冰的相關(guān)負(fù)責(zé)人就對(duì)此進(jìn)行了探討。
人們想象中的人工智能究竟是什么樣子?這其實(shí)是一個(gè)很難說清楚的問題,不過我相信就現(xiàn)在的人工智能產(chǎn)品來說,應(yīng)該都達(dá)不到人們想象當(dāng)中樣子。
微軟小冰資深產(chǎn)品總監(jiān)曹文韜就對(duì)這一問題給出了解答,“人工智能的出現(xiàn)已經(jīng)有很長(zhǎng)時(shí)間了,而且都是由科學(xué)家進(jìn)行定義的,是幫助人類完成某些事情的。但是大多數(shù)人期待的人工智能都是由藝術(shù)家塑造的,比如哆啦A夢(mèng),比如《Her》里面的薩曼莎,而這些人工智能的共同點(diǎn)不是幫人類做了多少事情,而是能夠變成人們身邊的朋友,在生活中完成與人的交流。”
而對(duì)于這樣在人們心目中根深蒂固的藝術(shù)家塑造的人工智能形象,我們?cè)趯?shí)際中所面臨的最大問題就是溝通的問題。讓人工智能像人一樣具備實(shí)時(shí)溝通的能力,是極其困難的一件事情,因?yàn)槿丝梢愿鶕?jù)情感的不同表現(xiàn)出不同的語氣、語調(diào)、語速等等,而情感卻是目前人工智能技術(shù)的一個(gè)不小的難題。
曹文韜表示:“溝通最核心的是如何做出一個(gè)情感模塊,現(xiàn)在小冰可以像一個(gè)人一樣可以打電話。這樣的一個(gè)感官,其實(shí)是一個(gè)全時(shí)的感官,它是更像一個(gè)人,能夠真正完成這樣一個(gè)過程。我們實(shí)實(shí)在在讓小冰這樣子的一個(gè)機(jī)器人,能夠給你打一通電話,并對(duì)這個(gè)溝通過程實(shí)時(shí)的檢測(cè)和識(shí)別,實(shí)時(shí)的理解。通過跟有信的合作,我們可以把這樣的場(chǎng)景帶到人類生活之中,那個(gè)時(shí)候我們認(rèn)為說我們重新定義一種人工智能和人類交互全新的標(biāo)準(zhǔn)。”
從目前人工智能與人類的交互方式上來看,基本都是一來一回有明顯結(jié)束方式的交互模式,比如說按一個(gè)按鍵,又或者說一個(gè)特定的詞語。而在實(shí)時(shí)通信中,什么時(shí)候應(yīng)當(dāng)說話,什么時(shí)候應(yīng)當(dāng)表達(dá)就都需要人工智能自己來判斷了。
作為一個(gè)實(shí)時(shí)音視頻通訊的平臺(tái),有信與微軟展開了戰(zhàn)略合作。在此之前,有信用戶已經(jīng)可以通過預(yù)約小冰來電與小冰進(jìn)行實(shí)時(shí)的溝通和互動(dòng)。有信通訊事業(yè)部總監(jiān)蔣斌給出了明確的數(shù)據(jù):“預(yù)約人數(shù)最后確定為23萬,而在這些預(yù)約的用戶之中,有531位幸運(yùn)者接聽到了小冰的來電,男性用戶占到了大部分。”
同時(shí),蔣斌還給出了一些有趣的數(shù)據(jù):在本次預(yù)約中,00后跟90后占到了預(yù)約總量的70%;大家跟小冰聊的最多的三個(gè)問題是吃了嗎,睡了嗎,在干嘛;天秤座更愿意跟小冰聊一些家常和情感上的話題;媒體、IT、財(cái)經(jīng)是三個(gè)最喜歡撩小冰的行業(yè)。
蔣斌還透露,8月底小冰將會(huì)正式入駐有信蜜語平臺(tái),到時(shí)候用戶無需預(yù)約也可以直接與小冰進(jìn)行實(shí)時(shí)的語音溝通。未來,有信也會(huì)將視頻引入其中,讓大家不僅可以與小冰進(jìn)行語音通信,還可以進(jìn)行實(shí)時(shí)的視頻對(duì)話。
在整場(chǎng)活動(dòng)中,曹文韜都透露著想讓小冰成為人們真正的好友,而想要達(dá)成這一點(diǎn),人工智能的情感溝通發(fā)展就成為了最為重要的一環(huán)。
“我們已經(jīng)在不同的過程中,不斷的檢測(cè)用戶在說話的情緒的變化的特點(diǎn)。當(dāng)情緒的變化,會(huì)實(shí)時(shí)的結(jié)合目前的情緒,帶出相應(yīng)的話語。這件事情在文本的狀態(tài)下或者音樂本身狀態(tài)下面,其實(shí)已經(jīng)做到了。我們今天利用全實(shí)感官,在有信上不僅僅能夠做到實(shí)時(shí)的互動(dòng),我們甚至可以實(shí)現(xiàn)知道你昨天不開心,小冰直接一通電話打到你身邊,問你今天好了一點(diǎn)沒有。真正實(shí)現(xiàn)跟這個(gè)用戶實(shí)時(shí)互動(dòng)的一個(gè)交流,這是我們希望的,正實(shí)現(xiàn)人工智能陪伴在你身邊。”
也許有一天,當(dāng)我們還在清晨的睡夢(mèng)中時(shí),叫醒我們的可能不是老板的電話或者鬧鐘的鈴聲,而是來自小冰的一通電話,而這樣的場(chǎng)景也讓人工智能真正走到了我們普通人的生活之中。
曹文韜表示,未來,微軟小冰會(huì)與有信進(jìn)行深入的合作,通過整個(gè)產(chǎn)品戰(zhàn)略以及互聯(lián)網(wǎng)推進(jìn)人工智能,推進(jìn)人工智能情感溝通,在通訊領(lǐng)域把實(shí)時(shí)人工智能的溫度感,帶入到身邊每一個(gè)大眾,讓大家真正感覺到我門身邊擁有這樣一個(gè)朋友,讓這個(gè)朋友無縫陪伴在我們身邊。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。