當?shù)貢r間8月19-23日 ,國際數(shù)據(jù)挖掘頂級會議KDD2018在英國倫敦舉行。滴滴技術團隊現(xiàn)場重點展示了在地圖服務、智能派單等領域的技術突破,并首次對外詳解相關算法實踐。滴滴還宣布進一步擴大其蓋亞數(shù)據(jù)開放計劃,新增174G的免費科研數(shù)據(jù)集,以開放協(xié)作支持全球科研工作者進行更廣泛學術研究。
滴滴在KDD現(xiàn)場分享出行交易中的大數(shù)據(jù)智能
四篇論文入選 交通出行中的人工智能大解密
KDD全稱是國際數(shù)據(jù)挖掘與知識發(fā)現(xiàn)大會(ACM SIGKDD Conference on Knowledge Discovery and Data Mining),今年已經是第24屆。作為是最有影響力的國際會議之一,大會的課程、報告、論文均被認為代表了領域內最新進展和最前沿應用。
在今年KDD2018上,滴滴共有四篇論文入選,涵蓋ETA預測 ( Estimated Time of Arrival,預估到達時間) 、智能派單、大規(guī)模車流管理等多個研究領域。此外,滴滴還重點舉辦了《交通出行中的人工智能(AI in Transportation)》輔導教程(Conventional Tutorial),吸引了來自學術界、工業(yè)界的200多名從業(yè)人員參與,成為現(xiàn)場最火爆的輔導教程之一。在近四小時的交流中,滴滴的研究團隊向現(xiàn)場聽眾全面地分享了智能交通出行領域中AI算法的挑戰(zhàn)、機遇及最新的應用進展,并就ETA預測、交通預測中對路網圖結構的利用、強化學習在交通領域的應用等問題進行了重點探討。
(KDD2018首日,滴滴舉辦輔導教程,吸引兩百多位專業(yè)人員參與)
路徑規(guī)劃(route planning)和ETA是地圖領域至關重要的兩項基礎服務。在路徑規(guī)劃部分,滴滴研究團隊梳理了經典的路徑規(guī)劃算法,闡述了如何轉換思路將路徑規(guī)劃問題建模成一個馬爾科夫過程,并引入強化學習技術來提升導航效果。而在ETA部分則回顧了規(guī)則模型、矩陣分解模型、時間序列模型,重點介紹了滴滴在ETA問題上的思考和進展,包括基于深度學習的Wide-deep-recurrent模型和基于多任務學習的路徑無關ETA模型。兩項算法實踐均寫入論文被KDD2018收錄。
(滴滴提出WDR模型顯著提升了ETA預測精度,算法專家KDD現(xiàn)場分享模型實踐)
除了地圖相關的內容之外,滴滴還分享了出行相關的其它重要算法。派單是出行場景中的核心步驟,為了更好的優(yōu)化派單效率,滴滴使用強化學習技術來構建派單算法,能基于對全天供需、出行行為的預測和歸納,考慮一天內司機整體的效率,能在確保乘客出行體驗的同時明顯提升司機的收入,這一模型實踐論文也在KDD 2018 中以口頭報告的形式發(fā)表。
(滴滴算法專家在KDD2018現(xiàn)場詳解強化學習在滴滴派單中的應用)
此外,滴滴還分析了AI技術在交通預測、智慧信號燈、交通模擬器、電動汽車充電樁運營和電池管理等問題上的運用。據(jù)介紹,以智慧信號燈為例,基于滴滴現(xiàn)有數(shù)據(jù)、交警地磁卡口數(shù)據(jù),再結合AI算法,滴滴能精準地預測每一個十字路口各個方向的車流量,并在此基礎上更加智能地做信號燈控制。目前,滴滴已經和二十多個城市進行智慧交通合作,幫助優(yōu)化了全中國超過1300多個紅綠燈,平均降低10%至20%的擁堵時間。未來,滴滴也將積極攜手更多城市合作伙伴,共建高效、環(huán)保的智慧交通體系。
蓋亞數(shù)據(jù)開放計劃擴大 二期新增174G免費科研數(shù)據(jù)集
(葉杰平教授在KDD2018現(xiàn)場發(fā)布新一期蓋亞數(shù)據(jù)開放計劃)
值得注意的是,在此次KDD上,滴滴還宣布進一步擴大其蓋亞數(shù)據(jù)開放計劃,新增174G的二期科研數(shù)據(jù)集,以開放協(xié)作支持全球科研工作者進行更廣泛學術研究。全球高校和科研機構的專家學者可登入蓋亞數(shù)據(jù)開放計劃網站提交相關信息免費獲取。
據(jù)悉,相較首期開放的2016年11月滴滴平臺專車和快車在成都部分區(qū)域內的原始軌跡數(shù)據(jù),此次二期數(shù)據(jù)集在時間和空間維度上均有擴大,不僅新增加了2016年10月成都市同一區(qū)域滴滴平臺專車和快車的原始軌跡數(shù)據(jù),還新開放了2016年10月和11月西安部分區(qū)域內專車和快車的原始軌跡數(shù)據(jù),能更好地支持學者進行節(jié)假日、非節(jié)假日及多城市的比較分析。
相關數(shù)據(jù)并不涉及任何用戶的個人信息。滴滴還對數(shù)據(jù)進行匿名化、加密等處理,能確保相關數(shù)據(jù)無法追溯到個人,無法還原。
滴滴AI Labs負責人葉杰平表示,滴滴一直在利用大數(shù)據(jù)、AI技術來改善城市的交通,也希望能和更多的科研工作者一起,激勵更多科技創(chuàng)新,在智慧交通前沿做出更多的前瞻探索,共同解決世界級的交通、環(huán)保挑戰(zhàn),“我們非常愿意向高校、科研機構開放部分脫敏數(shù)據(jù)和計算基礎設施,未來蓋亞數(shù)據(jù)開放計劃也將在保證安全的情況下不斷擴大。”
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結合大語言模型的敘事推理能力與音頻生成技術,通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠將復雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術,通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術僅需添加兩個線性層就能大幅提升運動質量,在多項測試中超越包括Sora在內的商業(yè)模型,為AI視頻生成的實用化應用奠定了重要基礎。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質量管控方法,讓AI在保持技術能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內完成10天全球天氣預報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經網絡技術,通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學領域帶來了效率和精度的雙重突破。