CNET科技資訊網(wǎng) 3月17日 國(guó)際報(bào)道:如果說(shuō)迪士尼樂(lè)園是人們美夢(mèng)成真的地方,那么約翰·斯諾迪(John Snoddy)就是那個(gè)“造夢(mèng)人”。
作為華特迪士尼幻想工程(Walt Disney Imagineering)產(chǎn)品研發(fā)工作室的負(fù)責(zé)人,斯諾迪于當(dāng)?shù)貢r(shí)間上周六在德克薩斯州奧斯汀舉辦的西南偏南大會(huì)(SXSW)上接受CNET采訪時(shí),介紹了迪士尼兩個(gè)使用了人工智能的項(xiàng)目。
這兩個(gè)項(xiàng)目是迪士尼創(chuàng)新遺產(chǎn)的一部分,它們可追溯到迪士尼公司創(chuàng)辦的那一年。在迪士尼樂(lè)園,這種創(chuàng)新探索為我們帶來(lái)了一級(jí)品,例如電子動(dòng)畫(huà)(Audio-Animatronics)以及美國(guó)第一個(gè)日常單軌系統(tǒng)的運(yùn)行。如今,這種創(chuàng)新將體現(xiàn)在一些以人工智能(AI)為動(dòng)力的產(chǎn)品上,如人工智能機(jī)器人Pascal、《魔發(fā)奇緣》中的變色龍伙計(jì)以及一個(gè)全新的《星球大戰(zhàn)》機(jī)器人Jake。
迪士尼“幻想工程師”甚至已經(jīng)偷偷在迪士尼樂(lè)園中做過(guò)了測(cè)驗(yàn)。舉例來(lái)說(shuō),其中的Pascal是一種微型機(jī)器人,樣子是一只綠色蜥蜴,剛好可以放在手上,可以想象一下,這只蜥蜴的眼睛、嘴和身體有多小。
不過(guò)這正是人工智能的酷炫之處,結(jié)合人工智能技術(shù)的Pascal可以自己活動(dòng)眼睛、嘴巴甚至臉上的皮膚,同時(shí)還可以配合手動(dòng)控制,就像一個(gè)小寵物。在斯諾迪看來(lái):“它不僅僅是一個(gè)玩偶,它是一個(gè)玩偶和表演者的融合體,就像一個(gè)演員。”
而另一個(gè)機(jī)器人Jake是一個(gè)完全自動(dòng)化、類(lèi)似于《星球大戰(zhàn)》里的R2-D2機(jī)器人,它喜歡在研發(fā)實(shí)驗(yàn)室里四處走動(dòng),就像一只寵物狗和與智能掃地機(jī)器人Roomba的結(jié)合體,只是更加可愛(ài)智能。
但在去年夏天,幻想工程師們將Jack從其實(shí)驗(yàn)室中“解放”了兩個(gè)月,讓它去迪士尼樂(lè)園的《星球大戰(zhàn)》發(fā)射臺(tái)地區(qū)交朋友?;蛟S成年人看了會(huì)覺(jué)得好玩,但孩子們肯定會(huì)想跟它們一起玩,會(huì)覺(jué)得機(jī)器人是真實(shí)存在的,會(huì)跟它們說(shuō)話(huà),會(huì)希望跟它們交朋友,甚至想要介紹給爸爸媽媽。
“解放的”Jack
斯諾迪表示,為迪斯尼樂(lè)園打造人工智能機(jī)器人的優(yōu)勢(shì)之一在于,游客們與它們互動(dòng)時(shí)所帶給它們的精神財(cái)富,他稱(chēng)之為“我們的游客所帶來(lái)的快樂(lè)”。
他說(shuō)道:“他們并沒(méi)有去戳它,也沒(méi)有去尋找它的工作原理。他們選擇的是另外一種美好的方式,希望與其進(jìn)行娛樂(lè)互動(dòng)。”“將我們自己上傳給Jake——這條路上我們已邁出腳步。”
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開(kāi)發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺(jué)解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺(jué)語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺(jué)信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。