當(dāng)?shù)貢r(shí)間8月19-23日 ,國(guó)際數(shù)據(jù)挖掘頂級(jí)會(huì)議KDD2018在英國(guó)倫敦舉行。滴滴技術(shù)團(tuán)隊(duì)現(xiàn)場(chǎng)重點(diǎn)展示了在地圖服務(wù)、智能派單等領(lǐng)域的技術(shù)突破,并首次對(duì)外詳解相關(guān)算法實(shí)踐。滴滴還宣布進(jìn)一步擴(kuò)大其蓋亞數(shù)據(jù)開放計(jì)劃,新增174G的免費(fèi)科研數(shù)據(jù)集,以開放協(xié)作支持全球科研工作者進(jìn)行更廣泛學(xué)術(shù)研究。
滴滴在KDD現(xiàn)場(chǎng)分享出行交易中的大數(shù)據(jù)智能
四篇論文入選 交通出行中的人工智能大解密
KDD全稱是國(guó)際數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)大會(huì)(ACM SIGKDD Conference on Knowledge Discovery and Data Mining),今年已經(jīng)是第24屆。作為是最有影響力的國(guó)際會(huì)議之一,大會(huì)的課程、報(bào)告、論文均被認(rèn)為代表了領(lǐng)域內(nèi)最新進(jìn)展和最前沿應(yīng)用。
在今年KDD2018上,滴滴共有四篇論文入選,涵蓋ETA預(yù)測(cè) ( Estimated Time of Arrival,預(yù)估到達(dá)時(shí)間) 、智能派單、大規(guī)模車流管理等多個(gè)研究領(lǐng)域。此外,滴滴還重點(diǎn)舉辦了《交通出行中的人工智能(AI in Transportation)》輔導(dǎo)教程(Conventional Tutorial),吸引了來自學(xué)術(shù)界、工業(yè)界的200多名從業(yè)人員參與,成為現(xiàn)場(chǎng)最火爆的輔導(dǎo)教程之一。在近四小時(shí)的交流中,滴滴的研究團(tuán)隊(duì)向現(xiàn)場(chǎng)聽眾全面地分享了智能交通出行領(lǐng)域中AI算法的挑戰(zhàn)、機(jī)遇及最新的應(yīng)用進(jìn)展,并就ETA預(yù)測(cè)、交通預(yù)測(cè)中對(duì)路網(wǎng)圖結(jié)構(gòu)的利用、強(qiáng)化學(xué)習(xí)在交通領(lǐng)域的應(yīng)用等問題進(jìn)行了重點(diǎn)探討。
(KDD2018首日,滴滴舉辦輔導(dǎo)教程,吸引兩百多位專業(yè)人員參與)
路徑規(guī)劃(route planning)和ETA是地圖領(lǐng)域至關(guān)重要的兩項(xiàng)基礎(chǔ)服務(wù)。在路徑規(guī)劃部分,滴滴研究團(tuán)隊(duì)梳理了經(jīng)典的路徑規(guī)劃算法,闡述了如何轉(zhuǎn)換思路將路徑規(guī)劃問題建模成一個(gè)馬爾科夫過程,并引入強(qiáng)化學(xué)習(xí)技術(shù)來提升導(dǎo)航效果。而在ETA部分則回顧了規(guī)則模型、矩陣分解模型、時(shí)間序列模型,重點(diǎn)介紹了滴滴在ETA問題上的思考和進(jìn)展,包括基于深度學(xué)習(xí)的Wide-deep-recurrent模型和基于多任務(wù)學(xué)習(xí)的路徑無關(guān)ETA模型。兩項(xiàng)算法實(shí)踐均寫入論文被KDD2018收錄。
(滴滴提出WDR模型顯著提升了ETA預(yù)測(cè)精度,算法專家KDD現(xiàn)場(chǎng)分享模型實(shí)踐)
除了地圖相關(guān)的內(nèi)容之外,滴滴還分享了出行相關(guān)的其它重要算法。派單是出行場(chǎng)景中的核心步驟,為了更好的優(yōu)化派單效率,滴滴使用強(qiáng)化學(xué)習(xí)技術(shù)來構(gòu)建派單算法,能基于對(duì)全天供需、出行行為的預(yù)測(cè)和歸納,考慮一天內(nèi)司機(jī)整體的效率,能在確保乘客出行體驗(yàn)的同時(shí)明顯提升司機(jī)的收入,這一模型實(shí)踐論文也在KDD 2018 中以口頭報(bào)告的形式發(fā)表。
(滴滴算法專家在KDD2018現(xiàn)場(chǎng)詳解強(qiáng)化學(xué)習(xí)在滴滴派單中的應(yīng)用)
此外,滴滴還分析了AI技術(shù)在交通預(yù)測(cè)、智慧信號(hào)燈、交通模擬器、電動(dòng)汽車充電樁運(yùn)營(yíng)和電池管理等問題上的運(yùn)用。據(jù)介紹,以智慧信號(hào)燈為例,基于滴滴現(xiàn)有數(shù)據(jù)、交警地磁卡口數(shù)據(jù),再結(jié)合AI算法,滴滴能精準(zhǔn)地預(yù)測(cè)每一個(gè)十字路口各個(gè)方向的車流量,并在此基礎(chǔ)上更加智能地做信號(hào)燈控制。目前,滴滴已經(jīng)和二十多個(gè)城市進(jìn)行智慧交通合作,幫助優(yōu)化了全中國(guó)超過1300多個(gè)紅綠燈,平均降低10%至20%的擁堵時(shí)間。未來,滴滴也將積極攜手更多城市合作伙伴,共建高效、環(huán)保的智慧交通體系。
蓋亞數(shù)據(jù)開放計(jì)劃擴(kuò)大 二期新增174G免費(fèi)科研數(shù)據(jù)集
(葉杰平教授在KDD2018現(xiàn)場(chǎng)發(fā)布新一期蓋亞數(shù)據(jù)開放計(jì)劃)
值得注意的是,在此次KDD上,滴滴還宣布進(jìn)一步擴(kuò)大其蓋亞數(shù)據(jù)開放計(jì)劃,新增174G的二期科研數(shù)據(jù)集,以開放協(xié)作支持全球科研工作者進(jìn)行更廣泛學(xué)術(shù)研究。全球高校和科研機(jī)構(gòu)的專家學(xué)者可登入蓋亞數(shù)據(jù)開放計(jì)劃網(wǎng)站提交相關(guān)信息免費(fèi)獲取。
據(jù)悉,相較首期開放的2016年11月滴滴平臺(tái)專車和快車在成都部分區(qū)域內(nèi)的原始軌跡數(shù)據(jù),此次二期數(shù)據(jù)集在時(shí)間和空間維度上均有擴(kuò)大,不僅新增加了2016年10月成都市同一區(qū)域滴滴平臺(tái)專車和快車的原始軌跡數(shù)據(jù),還新開放了2016年10月和11月西安部分區(qū)域內(nèi)專車和快車的原始軌跡數(shù)據(jù),能更好地支持學(xué)者進(jìn)行節(jié)假日、非節(jié)假日及多城市的比較分析。
相關(guān)數(shù)據(jù)并不涉及任何用戶的個(gè)人信息。滴滴還對(duì)數(shù)據(jù)進(jìn)行匿名化、加密等處理,能確保相關(guān)數(shù)據(jù)無法追溯到個(gè)人,無法還原。
滴滴AI Labs負(fù)責(zé)人葉杰平表示,滴滴一直在利用大數(shù)據(jù)、AI技術(shù)來改善城市的交通,也希望能和更多的科研工作者一起,激勵(lì)更多科技創(chuàng)新,在智慧交通前沿做出更多的前瞻探索,共同解決世界級(jí)的交通、環(huán)保挑戰(zhàn),“我們非常愿意向高校、科研機(jī)構(gòu)開放部分脫敏數(shù)據(jù)和計(jì)算基礎(chǔ)設(shè)施,未來蓋亞數(shù)據(jù)開放計(jì)劃也將在保證安全的情況下不斷擴(kuò)大。”
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對(duì)弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。