埃隆·馬斯克曾經(jīng)多次強(qiáng)調(diào),特斯拉公司將在2020年年底之前打造出全自動(dòng)駕駛汽車。“這方面存在很多小問題,最大的挑戰(zhàn)就是如何把這些小問題全數(shù)解決掉,再整合進(jìn)一套統(tǒng)一的系統(tǒng)當(dāng)中。”
雖然這種完全無需人為干預(yù)就能應(yīng)對旅程中種種狀況的汽車(業(yè)界稱之為「L5級(jí)自動(dòng)駕駛」)也許正在走近,但實(shí)際生產(chǎn)出能夠安全合法上路的自動(dòng)汽車卻又是另一碼事。
全自動(dòng)駕駛汽車之所以遲遲上不了路,是因?yàn)槠渲腥源嬖谥簧俑拘蕴魬?zhàn)。下面來看五大最為核心的障礙。
1. 傳感器
自動(dòng)駕駛汽車使用各種各樣的傳感器以“觀察”周邊環(huán)境,幫助系統(tǒng)檢測諸如行人、其他車輛以及路標(biāo)等物體。攝像頭負(fù)責(zé)幫助汽車獲得視覺,激光雷達(dá)負(fù)責(zé)測量物體與車輛之間的距離,普通雷達(dá)則檢測物體并跟蹤其行進(jìn)速度與方向。
這些傳感器會(huì)不斷將數(shù)據(jù)饋送至汽車的控制系統(tǒng)或計(jì)算機(jī)端,借此決定應(yīng)在哪里轉(zhuǎn)向或者何時(shí)進(jìn)行制動(dòng)。全自動(dòng)駕駛汽車需要一套能夠在一切條件及環(huán)境下,準(zhǔn)確檢測物體、距離、速度等指標(biāo)的傳感器,且全程無需人為介入。
但惡劣的天氣、繁忙的交通以及帶有涂鴉的道路標(biāo)志,都會(huì)對傳感器的識(shí)別能力產(chǎn)生負(fù)面影響。特斯拉使用的雷達(dá)雖然不太容易受到惡劣天氣條件的影響,但卻仍無法達(dá)到全自動(dòng)駕駛汽車對于物體檢測水平的嚴(yán)苛要求。
就目前的情況看,特斯拉的“autopilot”L2級(jí)自動(dòng)駕駛已經(jīng)釀成過不少事故,包括今年7月撞上了其他駐停車輛。事實(shí)證明,該公司的傳感器在應(yīng)對全天候行駛場景時(shí),還有很長的路要走。
2. 機(jī)器學(xué)習(xí)
大部分自動(dòng)駕駛汽車使用人工智能與機(jī)器學(xué)習(xí)處理來自傳感器的數(shù)據(jù),并根據(jù)結(jié)合做出關(guān)于下一步行動(dòng)的具體決策。這些算法將幫助系統(tǒng)識(shí)別傳感器檢測到的目標(biāo),并根據(jù)訓(xùn)練經(jīng)驗(yàn)將目標(biāo)分類為行人、路燈等。最后,汽車再使用此信息確定是否需要回避檢測到的物體,以及接下來需要采取哪些行動(dòng)——例如制動(dòng)或轉(zhuǎn)彎等。
未來,機(jī)器也許會(huì)擁有比人類駕駛員更高效的對象檢測與分類能力。但至少就目前來看,汽車中所使用的機(jī)器學(xué)習(xí)算法仍然缺少充分的安全性依據(jù)。在如何訓(xùn)練、測試或驗(yàn)證機(jī)器學(xué)習(xí)算法方面,各標(biāo)準(zhǔn)化機(jī)構(gòu)乃至整個(gè)自動(dòng)駕駛行業(yè)都還沒有達(dá)成共識(shí)。
3. 開放道路
自動(dòng)駕駛汽車在駛?cè)腴_放道路之后,還將繼續(xù)自己的學(xué)習(xí)過程。它會(huì)在新的路段上行駛,檢測出訓(xùn)練中從未遇到過的物體,并據(jù)此進(jìn)行軟件更新。
那么,我們該如何保證系統(tǒng)能夠始終擁有與已驗(yàn)證版本擁有相同的安全性?我們必須能夠證明一切新的學(xué)習(xí)結(jié)論都安全可靠,且系統(tǒng)不會(huì)忘記之前掌握的安全知識(shí)。遺憾的 是,業(yè)界目前對此還沒有統(tǒng)一的解決思路。
4. 監(jiān)管要求
不單是自動(dòng)駕駛領(lǐng)域,目前還沒有哪個(gè)行業(yè)針對自主系統(tǒng)出臺(tái)充分的標(biāo)準(zhǔn)與法規(guī)。現(xiàn)有車輛安全性的標(biāo)準(zhǔn)假設(shè),要求駕駛員能夠在緊急情況下立即接管。
對于自動(dòng)駕駛汽車,法規(guī)只針對某些特殊功能(例如自動(dòng)車道保持系統(tǒng))做出了規(guī)定。至于包括自動(dòng)駕駛汽車在內(nèi)的自動(dòng)駕駛系統(tǒng),雖然已經(jīng)有國際標(biāo)準(zhǔn)設(shè)定了部分相關(guān)要求,但暫時(shí)還沒有解決之前提到的傳感器、機(jī)器學(xué)習(xí)與行為學(xué)習(xí)方面的問題。
因此,只要沒有公認(rèn)的法規(guī)與標(biāo)準(zhǔn),自動(dòng)駕駛汽車無論是否安全、都無權(quán)在開放道路上正常行駛。
5. 社會(huì)接受度
特斯拉目前的自動(dòng)駕駛功能已經(jīng)先后引發(fā)多起事故。由此引發(fā)的社會(huì)認(rèn)可度低下問題不僅來自打算購買這類產(chǎn)品的用戶,也來自與這類用戶共享道路的其他交通參與者。
公眾需要參與到自動(dòng)駕駛汽車的引入與采用決策當(dāng)中。如果缺少這個(gè)環(huán)節(jié),此項(xiàng)技術(shù)就有可能被人民群眾拒之門外。
很明顯,只有解決了前三項(xiàng)挑戰(zhàn),我們才有機(jī)會(huì)攻克最后兩個(gè)障礙。目前,業(yè)界各方都在爭取成為第一家推出全自動(dòng)駕駛汽車的廠商。但是,如果我們未能就實(shí)現(xiàn)汽車安全、提供安全證明以及通過監(jiān)管機(jī)構(gòu)/公眾合作取得認(rèn)可接納達(dá)成共識(shí),那么自動(dòng)駕駛汽車在未來幾年中仍然只能長期處于測試階段。
對于馬斯克這樣的企業(yè)家來說,這樣的現(xiàn)狀無疑令人沮喪。但正是因?yàn)楸椴记G棘,率先在安全、保障、法規(guī)與接納度等領(lǐng)域取得突破的廠商,才能發(fā)展為新的巨頭、并引領(lǐng)整個(gè)新的時(shí)代。
好文章,需要你的鼓勵(lì)
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。