CNET科技資訊網(wǎng) 6月20日 北京消息:滴滴研究院副院長(zhǎng)&美國(guó)研究院負(fù)責(zé)人弓峰敏博士應(yīng)邀出席TechCrunch 國(guó)際創(chuàng)新峰會(huì)。在會(huì)上,弓峰敏向外界披露了滴滴在機(jī)器學(xué)習(xí)領(lǐng)域的成果,同時(shí)闡述了對(duì)人工智能以及智能駕駛技術(shù)未來(lái)發(fā)展的看法。
滴滴副總裁、美研負(fù)責(zé)人弓峰敏(右)
大數(shù)據(jù)是研究城市交通癥結(jié)的突破口
滴滴平臺(tái)每天接收、處理著全球最龐大也最復(fù)雜的路面交通數(shù)據(jù)。這些數(shù)據(jù)能幫助人們掌握每條小巷的路況,也能洞悉整座城市的流動(dòng)規(guī)律。
弓峰敏介紹說,在數(shù)據(jù)利用方面,滴滴致力于在深度和廣度上有所突破。就深度而言,數(shù)據(jù)學(xué)習(xí)可以幫助我們更深入理解用戶需求,提供個(gè)性化服務(wù)。在廣度的層面上,滴滴在將每一次出行,納入整個(gè)城市交通的體系。 “要做到這一點(diǎn),我們必須把大數(shù)據(jù)應(yīng)用技術(shù)有效無(wú)縫的與城市系統(tǒng)結(jié)合起來(lái)。將各種交通工具整合在一起,最終做到一鍵出行。”
對(duì)談中,弓峰敏提到了滴滴在智慧交通項(xiàng)目中一個(gè)具體的案例,“我們利用平臺(tái)車輛軌跡監(jiān)測(cè)交通狀況,以及每個(gè)紅綠燈擁擠程度,融合其他傳感設(shè)備,做了一個(gè)更準(zhǔn)確的交通流量預(yù)測(cè)。在此基礎(chǔ)上,滴滴設(shè)計(jì)了動(dòng)態(tài)紅綠燈方案調(diào)解擁堵。” 這個(gè)項(xiàng)目在濟(jì)南經(jīng)十路落地兩個(gè)月后,車輛在高峰期經(jīng)過六個(gè)紅綠燈下等待時(shí)間下降了10%。他相信大數(shù)據(jù)研究是滴滴核心的技術(shù)優(yōu)勢(shì),也是解決城市交通癥結(jié)的突破口
利用“智能機(jī)器”解決實(shí)際交通問題
業(yè)內(nèi)普遍認(rèn)為人工智能和大數(shù)據(jù)是密不可分的兩個(gè)概念。盡管,目前人們對(duì)人工智能和機(jī)器智能的定義有很多分歧,但在被譽(yù)為硅谷信息安全教父的弓峰敏看來(lái),無(wú)論哪一種智能,最后落腳點(diǎn)都是智能的機(jī)器。
弓峰敏認(rèn)為,人工智能是一個(gè)比較早的概念。早期科學(xué)家希望打造近似人類智能的機(jī)器,隨著技術(shù)發(fā)展,機(jī)器在某些方面超越了人類的能力,出現(xiàn)了高于人工智能的機(jī)器智能。但機(jī)器智能發(fā)展方向不應(yīng)該是取代人類,而是應(yīng)該體現(xiàn)在智能的機(jī)器上,這正是滴滴的研究方向。
無(wú)論是滴滴APP中的“猜你去哪”,還是街頭的智能交通信號(hào)燈,再到滴滴目前正在研究的智能駕駛,都是弓峰敏口中的“智能機(jī)器”。作為在硅谷打拼30多年的科技元老,他始終堅(jiān)信,“技術(shù)需要為人類服務(wù),幫助人類完成不可能完成的任務(wù)。
智能駕駛會(huì)改變未來(lái),但過程并不簡(jiǎn)單
自從滴滴表態(tài)投身于智能駕駛技術(shù)研究后,外界一直頻頻猜測(cè)研發(fā)進(jìn)展。隨著近幾年相關(guān)技術(shù)的迅速發(fā)展,人們開始期待智能駕駛在不久會(huì)在現(xiàn)實(shí)生活中廣泛引用。弓峰敏十分認(rèn)同未來(lái)智能駕駛技術(shù)將提升道路安全、有利于城市發(fā)展,但也提到了智能駕駛發(fā)展過程中行業(yè)普遍面臨的挑戰(zhàn)。
弓峰敏認(rèn)為,智能駕駛核心的基本技術(shù),比如計(jì)算機(jī)圖象、深度學(xué)習(xí)、如何配置傳感器等只是第一個(gè)門檻。第二個(gè)挑戰(zhàn)是解決過渡期,行人、無(wú)人車、有人車以及自行車等各方混行的問題。第三個(gè)挑戰(zhàn),是將這項(xiàng)技術(shù)放在各種實(shí)際的場(chǎng)景下,有序的投入使用。弓峰敏強(qiáng)調(diào),滴滴一直非常重視安全,同時(shí)擅長(zhǎng)分析、處理復(fù)雜的道路交通數(shù)據(jù),從而解決出難題。滴滴希望把這件事做好,讓技術(shù)服務(wù)于人類。
針對(duì)滴滴在智能駕駛領(lǐng)域的探索,弓峰敏透露,未來(lái)公司的研究團(tuán)隊(duì)希望通過AI和AR技術(shù)結(jié)合,提供更精確的導(dǎo)航,提示駕駛員容易忽略的道路風(fēng)險(xiǎn),最終提升道路行駛安全。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。