成立一年之際,阿里巴巴前沿技術(shù)研究機(jī)構(gòu)達(dá)摩院又傳來(lái)新進(jìn)展。以色列理工學(xué)院著名計(jì)算機(jī)視覺(jué)科學(xué)家Lihi Zelnik-Manor教授,已入職達(dá)摩院以色列機(jī)器視覺(jué)實(shí)驗(yàn)室。
作為實(shí)驗(yàn)室負(fù)責(zé)人,她將帶領(lǐng)團(tuán)隊(duì)推動(dòng)達(dá)摩院計(jì)算機(jī)視覺(jué)領(lǐng)域的基礎(chǔ)研究,以及新零售、智慧城市等廣泛領(lǐng)域的應(yīng)用結(jié)合。
以色列機(jī)器視覺(jué)研究實(shí)驗(yàn)室,是達(dá)摩院遍布全球的科研機(jī)構(gòu)之一,也是達(dá)摩院首支完全由外籍科學(xué)家組成的研發(fā)團(tuán)隊(duì),成員來(lái)自于Intel、三星、特拉維夫大學(xué)等世界級(jí)研究機(jī)構(gòu)。
作為全球領(lǐng)先的創(chuàng)新之國(guó)與科技中心,以色列一直以從0到1的科技創(chuàng)新著稱全球,而中國(guó)則在先進(jìn)技術(shù)的大范圍普及運(yùn)用上積累了豐富經(jīng)驗(yàn)。未來(lái),達(dá)摩院設(shè)立在以色列的研發(fā)實(shí)驗(yàn)室將扮演創(chuàng)新樞紐的角色,結(jié)合中以兩國(guó)各自的創(chuàng)新優(yōu)勢(shì),促進(jìn)技術(shù)普惠與新商業(yè)模式的孵化。
機(jī)器視覺(jué)實(shí)驗(yàn)室正在研發(fā)的計(jì)算機(jī)視覺(jué)技術(shù),能有效提升計(jì)算機(jī)對(duì)外部物理世界的理解能力,在城市大腦、新零售等領(lǐng)域都有豐富的應(yīng)用場(chǎng)景。
諸如,通過(guò)視頻理解技術(shù),能有效提升城市大腦對(duì)對(duì)車輛行駛動(dòng)作、行人行為的識(shí)別判斷能力,提升城市道路的管理效率。而在新零售場(chǎng)景,智能貨架與AI收銀機(jī)能更精確的識(shí)別消費(fèi)者的購(gòu)買動(dòng)作,從而實(shí)現(xiàn)自動(dòng)結(jié)賬、智能防損等應(yīng)用。
圖說(shuō):達(dá)摩院以色列機(jī)器視覺(jué)實(shí)驗(yàn)室負(fù)責(zé)人 Lihi Zelnik-Manor 教授
加盟達(dá)摩院之前,Lihi Zelnik-Manor在以色列理工學(xué)院電氣工程系擔(dān)任副教授,領(lǐng)導(dǎo)該校的計(jì)算圖像與多媒體實(shí)驗(yàn)室。以色列理工學(xué)院也被譽(yù)為以色列的麻省理工,是以色列重要的基礎(chǔ)科學(xué)與計(jì)算機(jī)科技研究中心。
Lihi教授曾多次榮獲IEEE與ICCV的杰出論文獎(jiǎng),并連續(xù)多年擔(dān)任ECCV 與CVPR等計(jì)算機(jī)視覺(jué)大會(huì)的主席,此外她還是頂級(jí)學(xué)術(shù)期刊TPAMI的核心編輯。她還榮獲了以色列理工學(xué)院的Gutwirth獎(jiǎng),以表彰她在計(jì)算機(jī)視覺(jué)領(lǐng)域取得的杰出成就。
除了以色列外,達(dá)摩院已在新加坡、美國(guó)等多個(gè)國(guó)家與地區(qū)設(shè)立研發(fā)中心與實(shí)驗(yàn)室,并與新加坡南洋理工大學(xué)、斯坦福大學(xué)、加州大學(xué)伯克利分校、清華大學(xué)、浙江大學(xué)、中國(guó)科學(xué)院成立多個(gè)聯(lián)合研究基地。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。