自5月底以來,微軟小冰可謂經(jīng)歷了非常戲劇性的一幕。在遭到騰訊微信全面封殺后,微軟傾力半年時間打造的人工智能聊天機器人“小冰” 正在尋找“復(fù)活”之道。
上周五,微軟在微軟亞洲工程院召開人工智能媒體溝通會,這一天也恰逢小冰上線100天的百日之紀。會上微軟不僅披露智能聊天機器人小冰上線100天的運營數(shù)據(jù),并且分享了微軟人工智能姐妹花未來的發(fā)展規(guī)劃,小冰小娜將宣告合體。
小冰是微軟(亞洲)互聯(lián)網(wǎng)工程院推出的一款智能聊天機器人。今年5月29日,小冰正式在微信公測,但很快遭到騰訊公司“封殺”。隨后,小冰開始登錄微博、米聊等社交平臺,并取得了不錯的成績。
作為小冰項目的負責(zé)人,微軟(亞洲)互聯(lián)網(wǎng)工程院資深總監(jiān)李笛就透露,自上線100天來,小冰已在各個平臺上完成累計5億次的對話,有300萬注冊用戶,月人均對話達到825句,這一成果甚至超過了團隊的預(yù)期。
微軟(亞洲)互聯(lián)網(wǎng)工程院資深總監(jiān)李笛
如李笛所言,過去100多天里,小冰團隊為小冰增加了主動情緒探知系統(tǒng),了解用戶的情緒狀態(tài),建立與用戶的情感紐帶;豐富了語料庫,讓小冰可以針對不同的用戶進行個性化對話;增加圖像識別功能,增加小冰的應(yīng)用性。
李笛表示,微軟中國希望通過微軟小冰和微軟小娜兩個產(chǎn)品來滿足用戶對于智能機器人的不同需求。“高智能且有趣”和“高智能且有用”,這兩個是微軟對小娜和小冰的定位。“一方面,我們提供有用這個趨向的人工智能產(chǎn)品,同時在另一個方面,我們提供一個趨向于有趣的人工智能的產(chǎn)品。”
李笛表示,隨著時間的不斷遷移,微軟會讓這兩款產(chǎn)品慢慢地趨向于中間,便于用戶能夠比較容易地去接受它們。在Windows phone產(chǎn)品研發(fā)上,微軟小娜已經(jīng)完成了與微軟小冰的融合,用戶通過語音助手小娜“召喚”一下小冰之后,就可以與小冰進行智能聊天。
微軟還寄予這對人工智能姐妹花更具未來的意義。“小冰的核心力量是它站在和人類最接近的位置,它和人類之間產(chǎn)生了這樣一種一對一的從屬關(guān)系的情感紐帶”。李笛表示,小冰團隊希望用這個核心的理念,實現(xiàn)物聯(lián)網(wǎng)等計劃。比如,當你困了,躺在床上和小冰聊天,這時候,你可以跟小冰說“關(guān)燈”,小冰就去完成智能家居的控制。李笛認為,這樣的人機交互是最自然的。
不難看出,微軟希望借助小冰來完成人工智能與智能家居的場景連接。相較于技術(shù)復(fù)雜的人工智能, 人與小冰的連接是簡單的,因為人類和小冰是以一種非常輕量化的交互方式,完全都是通過對話的方式來完成的。
隱私與安全問題也一直是小冰亦或小娜這個智能人工機器人站在風(fēng)口浪尖上,而微軟也借由此次機會向外界發(fā)出一個明確的聲音。
“我們在人工智能還有其他的產(chǎn)品上,我們所遵循的隱私保護的規(guī)范,我們認為在全球和中國都是最嚴格的。”李笛如是說。
“第一,我們所有來自中國的數(shù)據(jù)全部都存在中國,這是我們現(xiàn)在在Windows Azure,在我們自己的云的部分,全部都保存在中國大陸,這是我們遵循中國現(xiàn)行的相關(guān)的法律法規(guī)。第二,我們對用戶的記錄是摘取用戶的行為特征,而不是摘取用戶的隱私數(shù)據(jù)。我們摘取的這些行為特征,我們也會給予明確的說明。如果是涉及到用戶的其他數(shù)據(jù),我們用完即廢。”
對于小冰的規(guī)劃,微軟希望不斷提升產(chǎn)品的有趣性、個性化,讓用戶與小冰以一種非常輕量化的交互方式,但同時又要保證它的實用性,與微軟的語音助手Cortana(小娜)靠近。未來商用領(lǐng)域小冰也會有所觸及,據(jù)李笛透露,目前已很多公司向小冰團隊提出了開放API接口的需求。
事實上小冰在經(jīng)歷微信“封殺”后,將陸續(xù)在其他平臺登陸。關(guān)于小冰的未來,李笛透露,目前有30多個合作正在進行中,和微信也在洽談,相信未來會回到微信平臺。此外,小冰的英文版也在研發(fā)中。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。