近期,信息檢索領(lǐng)域頂級(jí)會(huì)議ACM SIGIR2018在美國密歇根安娜堡成功舉辦,滴滴技術(shù)團(tuán)隊(duì)深度參與了大會(huì),并主辦智能交通信息學(xué)專題討論會(huì),詳細(xì)介紹了滴滴在出行領(lǐng)域的探索和實(shí)踐并分享了產(chǎn)學(xué)研合作經(jīng)驗(yàn)。滴滴方面還表示,后續(xù)將積極以開放協(xié)作攜手科研工作者進(jìn)行更廣泛學(xué)術(shù)研究,共同解決世界級(jí)的交通、環(huán)保挑戰(zhàn)。
ACM SIGIR 是國際計(jì)算機(jī)學(xué)會(huì)主辦的信息檢索領(lǐng)域最重要的學(xué)術(shù)會(huì)議,今年已是第四十一屆。每年SIGIR都會(huì)匯集來自世界各地的頂尖信息檢索研究人員和從業(yè)人員,對外展示最新技術(shù)和最新成果發(fā)現(xiàn)。此次SIGIR 2018 共收到論文 736篇,錄用184篇(其中長文投稿 409 篇,錄用86篇),會(huì)議參會(huì)人數(shù)近800人。
滴滴技術(shù)團(tuán)隊(duì)撰寫的《Taxi or Hitchhiking: Predicting Passenger's Preferred Service on Ride Sharing Platforms》論文也被大會(huì)收錄。通過對用戶的出行選擇進(jìn)行建模,該文章提出了一個(gè)基于用戶時(shí)間、空間和行為特征的推薦系統(tǒng),能幫助解決用戶出行需求和偏好上的預(yù)測和推薦問題。離線的模擬表明該模型能大幅提高準(zhǔn)確率并且?guī)椭脩舾咝У剡M(jìn)行出行規(guī)劃。
(滴滴算法專家現(xiàn)場講解論文,吸引了眾多國內(nèi)外同行與專家學(xué)者來交流。)
不僅是論文接收,大會(huì)的主題報(bào)告同樣也備受外界關(guān)注。在SIGIR 2018上,滴滴副總裁、AI Labs負(fù)責(zé)人葉杰平教授發(fā)表了主題演講,詳細(xì)介紹了滴滴如何利用人工智能技術(shù)幫助提升用戶出行體驗(yàn)、解決全球交通挑戰(zhàn),并重點(diǎn)分析了滴滴在智能派單、智能地圖、智能客服、語音識(shí)別、智慧交通等領(lǐng)域的實(shí)踐經(jīng)驗(yàn)。在葉杰平看來,人工智能技術(shù)在交通方面的改變是多層次的,未來在交通基礎(chǔ)設(shè)施、車輛交通工具、共享出行三個(gè)層次都將會(huì)出現(xiàn)歷史性的變革,而滴滴也早已積極布局:不僅包括底層基礎(chǔ)的AI算法以及核心的AI 技術(shù),如語音、自然語言處理、圖像,還包括由AI技術(shù)支持的應(yīng)用--提升用戶體驗(yàn)、助力城市建設(shè)智慧交通網(wǎng)絡(luò)以及積極布局智能駕駛及新能源汽車等。
(滴滴AI Labs負(fù)責(zé)人葉杰平教授在SIGIR現(xiàn)場暢談滴滴的AI布局和技術(shù)創(chuàng)新。)
據(jù)介紹,在城市交通領(lǐng)域,目前滴滴已經(jīng)與濟(jì)南、貴陽、沈陽、南京、武漢等20多個(gè)城市展開合作,幫助優(yōu)化了超過1300個(gè)智慧信號(hào)燈,平均降低了10%-20%的擁堵時(shí)間。“我們還將持續(xù)投入,并且廣泛合作,將人工智能應(yīng)用拓展至社會(huì)公益領(lǐng)域,讓技術(shù)創(chuàng)造更大價(jià)值”,葉杰平說。
學(xué)術(shù)界和產(chǎn)業(yè)界的結(jié)合也是大會(huì)關(guān)注的一大重點(diǎn)。滴滴副總裁、智能出行部負(fù)責(zé)人郄小虎在SIGIR大數(shù)據(jù)產(chǎn)學(xué)研交流會(huì)上,對外分享了滴滴的產(chǎn)學(xué)研合作經(jīng)驗(yàn)。他表示,滴滴擁有豐富的數(shù)據(jù)積累,基于領(lǐng)先的大數(shù)據(jù)和技術(shù)優(yōu)勢,滴滴正在持續(xù)推進(jìn)技術(shù)前沿,同時(shí)積極攜手學(xué)界為新的可持續(xù)發(fā)展提出解決方案。
(滴滴智能出行部負(fù)責(zé)人郄小虎在現(xiàn)場詳解滴滴的科研合作經(jīng)驗(yàn)以及人才培養(yǎng)機(jī)制)
郄小虎稱,除向?qū)W界開放脫敏數(shù)據(jù)資源、開放計(jì)算基礎(chǔ)設(shè)施外,滴滴還先后與密西根大學(xué)、斯坦福大學(xué)人工智能實(shí)驗(yàn)室、中國計(jì)算機(jī)學(xué)會(huì)、香港科技大學(xué)、電氣電子工程協(xié)會(huì)等國內(nèi)外十余家學(xué)術(shù)科研機(jī)構(gòu)建立科研合作關(guān)系,共同在人工智能、智慧交通、智能駕駛、經(jīng)濟(jì)學(xué)、運(yùn)籌學(xué)等領(lǐng)域進(jìn)行探索交流、人才培養(yǎng)等,攜手助推交通產(chǎn)業(yè)不斷向前突破。近期滴滴還將公布新一輪主題研究計(jì)劃,希望能與更多專業(yè)領(lǐng)域內(nèi)的優(yōu)秀學(xué)者展開合作。
(密西根大學(xué)Pascal Van Hentenryck教授在研討會(huì)上分享自己對未來出行變革的看法)
值得注意的是,本次大會(huì)上,滴滴還主辦了智能交通信息學(xué)研討會(huì)并公開征集論文,攜手密西根大學(xué)Pascal Van Hentenryck、華盛頓大學(xué)班學(xué)鋼等教授共同分享了當(dāng)前城市交通治理領(lǐng)域的前沿探索,同時(shí)對智能交通信息學(xué)的未來進(jìn)行探討。經(jīng)過組委會(huì)評選,最終有七篇論文在研討會(huì)上集中展示。
研討會(huì)現(xiàn)場,滴滴通過兩篇論文《POI Semantic Model with a Deep Convolutional Structure》、《DiDi Ride Cancellation Smart Fault Determination System》重點(diǎn)展示了在POI(信息點(diǎn))檢索、取消判責(zé)領(lǐng)域的研究成果和實(shí)踐。以POI檢索為例,滴滴技術(shù)團(tuán)隊(duì)提出一種基于深度卷積網(wǎng)絡(luò)的POI語義模型(Deep POI Semantic Model),能將輸入文本通過深度網(wǎng)絡(luò)模型映射到語義向量空間,從而計(jì)算向量之間的相似度值得到文本之間的相關(guān)性,有效地解決POI檢索場景下的相關(guān)性匹配問題,提高滴滴地圖的檢索滿意度。而取消判責(zé),則創(chuàng)新性地提出了一種基于機(jī)器學(xué)習(xí)+規(guī)則的混合算法,能引入數(shù)以萬維的特征作為輸入,獲得更高的準(zhǔn)確率和召回率,顯著提升用戶體驗(yàn)。
上海交通大學(xué)張偉楠副教授現(xiàn)場感言,研討會(huì)向SIGIR社區(qū)展示了信息檢索主題如何賦能全新領(lǐng)域,內(nèi)容非常新穎。華盛頓大學(xué)班學(xué)鋼教授也評價(jià)稱,滴滴持續(xù)向?qū)W界推進(jìn)數(shù)據(jù)開放、推廣高校合作,攜手學(xué)界發(fā)現(xiàn)、定義問題,這一做法非常值得更多企業(yè)借鑒。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。