首先與大家分享一個(gè)場(chǎng)景:“……哈巴狗一般大小、名叫‘先鋒’的機(jī)器人慢慢向前翻滾著,逐漸靠近地毯上的玩具‘美國(guó)隊(duì)長(zhǎng)’,它們對(duì)峙站立的地方是一間兒童臥室,Qualcomm在一輛房車(chē)中搭建了這個(gè)空間。“先鋒”的動(dòng)作停頓了下來(lái),好像在評(píng)估周遭環(huán)境,然后,它用自己身前像雪鏟一樣的工具把美國(guó)隊(duì)長(zhǎng)攬入懷中,轉(zhuǎn)個(gè)身,把它向三個(gè)矮矮的玩具箱推去。 高級(jí)工程師Ilwoo Chang抬起兩只手臂,指向應(yīng)該投放‘美國(guó)隊(duì)長(zhǎng)’的那個(gè)箱子。‘先鋒’的攝像頭看到了這個(gè)動(dòng)作,乖乖地照做了。然后它又翻滾著折返,發(fā)現(xiàn)了另一個(gè)動(dòng)作片人物‘蜘蛛俠’。”
(圖片來(lái)自于《麻省理工科技評(píng)論》)
這個(gè)演示完成于Qualcomm圣迭戈總部,Qualcomm稱(chēng)其為Zeroth項(xiàng)目,描述來(lái)自科技期刊《麻省理工科技評(píng)論》(MIT Technology Review)的記者。近日這家期刊評(píng)選出2014年全球十大突破技術(shù):Qualcomm神經(jīng)形態(tài)芯片(即Zeroth項(xiàng)目)、基因編輯、靈巧性機(jī)器人、超私密智能手機(jī)、微距3D打印、移動(dòng)協(xié)作、智能風(fēng)能和太陽(yáng)能、虛擬現(xiàn)實(shí)、農(nóng)用無(wú)人機(jī)和腦部圖譜。
“通過(guò)Qualcomm Zeroth項(xiàng)目,你可以窺見(jiàn)計(jì)算的未來(lái)。 機(jī)器人完成的這些任務(wù)過(guò)去通常需要強(qiáng)大的、經(jīng)過(guò)專(zhuān)門(mén)編程的計(jì)算機(jī)完成,耗費(fèi)的電力也多得多。而‘先鋒’只是配備了一個(gè)智能手機(jī)芯片和專(zhuān)門(mén)的軟件,就能識(shí)別從前機(jī)器人無(wú)法識(shí)別的物體,根據(jù)它們與相關(guān)物體的相似程度來(lái)做分類(lèi),再把它們傳送到房間中正確的位置。 這一切并不是源于繁復(fù)的編程,而只是因?yàn)槿讼蛩菔具^(guò)一次它該往哪里走。機(jī)器人可以做到這些,是因?yàn)樗7铝巳四X的運(yùn)作,盡管這種模仿非常有限。” 《麻省理工科技評(píng)論》如此評(píng)論這次演示。
關(guān)于Zeroth,過(guò)去幾年中,Qualcomm研發(fā)團(tuán)隊(duì)一直致力于開(kāi)發(fā)一種突破傳統(tǒng)模式的全新計(jì)算架構(gòu)。他們希望打造一個(gè)全新的計(jì)算處理器,模仿人類(lèi)的大腦和神經(jīng)系統(tǒng),使終端擁有大腦模擬計(jì)算驅(qū)動(dòng)的嵌入式認(rèn)知——這就是Zeroth。也就是說(shuō),Qualcomm正在把硅片和生物系統(tǒng)間的界限變模糊,未來(lái)你的智能手機(jī)等終端將預(yù)期你下一步想干什么。
“仿生式學(xué)習(xí)”、“使終端能夠像人類(lèi)一樣觀察和感知世界”、“神經(jīng)處理單元(NPU)的創(chuàng)造和定義”是Zeroth的三個(gè)目標(biāo)。關(guān)于“仿生式學(xué)習(xí)”,值得注意的是,Qualcomm實(shí)現(xiàn)其是通過(guò)基于神經(jīng)傳導(dǎo)物質(zhì)多巴胺的學(xué)習(xí)(又名“正強(qiáng)化”)完成的——而非編寫(xiě)代碼。
稍早前,基于Zeroth,Qualcomm研發(fā)部門(mén)參與了一個(gè)突破性的研究,并將其發(fā)現(xiàn)發(fā)表在《自然》雜志上,解釋哺乳動(dòng)物的大腦是如何對(duì)運(yùn)動(dòng)進(jìn)行探測(cè)的。其工程師說(shuō),“Qualcomm研發(fā)部門(mén)的工作人員以解決重大挑戰(zhàn)為榮,其中一項(xiàng)挑戰(zhàn)是認(rèn)識(shí)人腦——最復(fù)雜、最多面的進(jìn)化產(chǎn)物。作為這項(xiàng)先驅(qū)工作的一部分,我們還建立了模擬視網(wǎng)膜和神經(jīng)元的數(shù)學(xué)模型和算法,讓整個(gè)科學(xué)界能夠在進(jìn)一步的研究和測(cè)試中使用和利用。”這樣的表述與Qualcomm執(zhí)行董事長(zhǎng)保羅·雅各布日前在中國(guó)南京發(fā)表的演講相呼應(yīng),雅各布說(shuō),“(科技進(jìn)步)這一切背后的推動(dòng)力是什么?我相信是發(fā)明創(chuàng)造,是創(chuàng)新為這個(gè)市場(chǎng)帶來(lái)了增長(zhǎng),為消費(fèi)者帶來(lái)了新的服務(wù)和新的能力。”
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開(kāi)發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺(jué)解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺(jué)語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺(jué)信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。