7月20日,滴滴Di-Tech算法大賽落幕,一等獎(jiǎng)獲得者拿到了10萬美元的大獎(jiǎng)。在算法大賽圓桌會(huì)議上,滴滴研究院院長(zhǎng)何曉飛解釋了自己如何被滴滴吸引,并且給業(yè)內(nèi)頂尖人才提出建議,應(yīng)該解決更多有價(jià)值的實(shí)際問題。
何曉飛把人工智能的來臨形容為“大勢(shì)所趨”,而自己來滴滴則是“順勢(shì)而為”。在過去10年,中國(guó)學(xué)術(shù)界和工業(yè)界總體來講是隔離的。但在美國(guó),這個(gè)氛圍是不一樣的。美國(guó)很多高校解決的問題不是純粹意義的研究,而是直接去解決工業(yè)界的需求,產(chǎn)業(yè)和工業(yè)互相促進(jìn)。
目前滴滴要解決的出行問題,跟谷歌AlphaGo一樣,都需要人工智能,不一樣的地方是,滴滴需要的計(jì)算比AlphaGo更加復(fù)雜。因?yàn)槊恳粭l道路都是計(jì)算網(wǎng)格中的一部分,道路的網(wǎng)格復(fù)雜度遠(yuǎn)遠(yuǎn)超過圍棋網(wǎng)格,此外還需要增加時(shí)間維度,因?yàn)樗緳C(jī)在路上行駛,所以每一秒鐘,需求都會(huì)發(fā)生變化。
在人工智能領(lǐng)域,算法是引擎,大數(shù)據(jù)是燃料。目前高校有最聰明的人才,但是他們得不到大數(shù)據(jù)燃料,所以很難訓(xùn)練出更聰明的算法引擎。本次滴滴算法大賽開放了滴滴平臺(tái)上部分脫敏數(shù)據(jù),給參賽人員進(jìn)行研究,得到數(shù)據(jù)的參賽隊(duì)伍交出了令人驚喜的算法。
之后,滴滴希望跟高校有更多合作,但是不希望成為企業(yè)拋出問題給研究機(jī)構(gòu)解決這種模式。而是希望通過長(zhǎng)期合作、開放共贏的方式,實(shí)現(xiàn)共同成長(zhǎng)。高校有一流的研究人才,在基礎(chǔ)研究領(lǐng)域有深厚的積累,滴滴有海量的大數(shù)據(jù),需要解決出行的基礎(chǔ)問題,雙方很多合作契機(jī)。
滴滴研究院副教授葉杰平曾經(jīng)是密歇根大學(xué)終身教授,加入滴滴同樣也是被人工智能即將到來的“召喚”、滴滴要解決的世界難題,以及滴滴所擁有的海量數(shù)據(jù)所吸引。除了完成日常工作之外,葉杰平教授在滴滴開設(shè)了人工智能課程,通過講課的方式使算法人才得到更快的成長(zhǎng)。
除了召開算法大賽之外,滴滴還在探索其他與高校合作的形式。比如去年開始的“新銳計(jì)劃”,對(duì)研究生、博士生有特別好的人工智能算法基礎(chǔ)的,滴滴會(huì)有一個(gè)專門的綠色通道。同時(shí),滴滴也在探索更多其他數(shù)據(jù)、項(xiàng)目上的合作方式。
何曉飛認(rèn)為,雖然機(jī)器學(xué)習(xí)已經(jīng)提出很多年,但隨著計(jì)算能力、大數(shù)據(jù)存儲(chǔ)能力的提高,人工智能大規(guī)模爆發(fā)的契機(jī)已經(jīng)來臨,而算法引擎需要更多頂尖人才的參與,需要學(xué)術(shù)界和工業(yè)界共同的合作和努力。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。