CNET科技資訊網(wǎng) 6月20日 北京消息:滴滴研究院副院長&美國研究院負責人弓峰敏博士應邀出席TechCrunch 國際創(chuàng)新峰會。在會上,弓峰敏向外界披露了滴滴在機器學習領域的成果,同時闡述了對人工智能以及智能駕駛技術未來發(fā)展的看法。
滴滴副總裁、美研負責人弓峰敏(右)
大數(shù)據(jù)是研究城市交通癥結(jié)的突破口
滴滴平臺每天接收、處理著全球最龐大也最復雜的路面交通數(shù)據(jù)。這些數(shù)據(jù)能幫助人們掌握每條小巷的路況,也能洞悉整座城市的流動規(guī)律。
弓峰敏介紹說,在數(shù)據(jù)利用方面,滴滴致力于在深度和廣度上有所突破。就深度而言,數(shù)據(jù)學習可以幫助我們更深入理解用戶需求,提供個性化服務。在廣度的層面上,滴滴在將每一次出行,納入整個城市交通的體系。 “要做到這一點,我們必須把大數(shù)據(jù)應用技術有效無縫的與城市系統(tǒng)結(jié)合起來。將各種交通工具整合在一起,最終做到一鍵出行。”
對談中,弓峰敏提到了滴滴在智慧交通項目中一個具體的案例,“我們利用平臺車輛軌跡監(jiān)測交通狀況,以及每個紅綠燈擁擠程度,融合其他傳感設備,做了一個更準確的交通流量預測。在此基礎上,滴滴設計了動態(tài)紅綠燈方案調(diào)解擁堵。” 這個項目在濟南經(jīng)十路落地兩個月后,車輛在高峰期經(jīng)過六個紅綠燈下等待時間下降了10%。他相信大數(shù)據(jù)研究是滴滴核心的技術優(yōu)勢,也是解決城市交通癥結(jié)的突破口
利用“智能機器”解決實際交通問題
業(yè)內(nèi)普遍認為人工智能和大數(shù)據(jù)是密不可分的兩個概念。盡管,目前人們對人工智能和機器智能的定義有很多分歧,但在被譽為硅谷信息安全教父的弓峰敏看來,無論哪一種智能,最后落腳點都是智能的機器。
弓峰敏認為,人工智能是一個比較早的概念。早期科學家希望打造近似人類智能的機器,隨著技術發(fā)展,機器在某些方面超越了人類的能力,出現(xiàn)了高于人工智能的機器智能。但機器智能發(fā)展方向不應該是取代人類,而是應該體現(xiàn)在智能的機器上,這正是滴滴的研究方向。
無論是滴滴APP中的“猜你去哪”,還是街頭的智能交通信號燈,再到滴滴目前正在研究的智能駕駛,都是弓峰敏口中的“智能機器”。作為在硅谷打拼30多年的科技元老,他始終堅信,“技術需要為人類服務,幫助人類完成不可能完成的任務。
智能駕駛會改變未來,但過程并不簡單
自從滴滴表態(tài)投身于智能駕駛技術研究后,外界一直頻頻猜測研發(fā)進展。隨著近幾年相關技術的迅速發(fā)展,人們開始期待智能駕駛在不久會在現(xiàn)實生活中廣泛引用。弓峰敏十分認同未來智能駕駛技術將提升道路安全、有利于城市發(fā)展,但也提到了智能駕駛發(fā)展過程中行業(yè)普遍面臨的挑戰(zhàn)。
弓峰敏認為,智能駕駛核心的基本技術,比如計算機圖象、深度學習、如何配置傳感器等只是第一個門檻。第二個挑戰(zhàn)是解決過渡期,行人、無人車、有人車以及自行車等各方混行的問題。第三個挑戰(zhàn),是將這項技術放在各種實際的場景下,有序的投入使用。弓峰敏強調(diào),滴滴一直非常重視安全,同時擅長分析、處理復雜的道路交通數(shù)據(jù),從而解決出難題。滴滴希望把這件事做好,讓技術服務于人類。
針對滴滴在智能駕駛領域的探索,弓峰敏透露,未來公司的研究團隊希望通過AI和AR技術結(jié)合,提供更精確的導航,提示駕駛員容易忽略的道路風險,最終提升道路行駛安全。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結(jié)構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結(jié)合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。