科技行者 11月18日 北京消息(文/周雅):「自動駕駛」不是一個新話題,但每次出現(xiàn)都飽受爭議,很長一段時間以來,圍繞自動駕駛的技術(shù)、汽車行業(yè)乃至社會倫理的聲音從來沒有斷過,而這正是恩智浦資深副總裁兼首席技術(shù)官Lars Reger每天要解決的實際問題。
圖:恩智浦資深副總裁兼首席技術(shù)官Lars Reger
Lars Reger 是一位不折不扣的資深工程師,在「微電子領(lǐng)域」積累了數(shù)十年的經(jīng)驗,而他把這些經(jīng)驗全部都投入到了汽車產(chǎn)業(yè)當中,在他漫長的職業(yè)生涯里,先后見證了西門子半導(dǎo)體公司、英飛凌、德國大陸集團的幾輪技術(shù)創(chuàng)新和產(chǎn)品迭代。2008年Lars加入恩智浦,并于2018年12月開始全面執(zhí)掌恩智浦的技術(shù)工作。長久以來,這位CTO接觸的一直都是「汽車電子」「工業(yè) 4.0」「物聯(lián)網(wǎng)」「連接」「V2X」這些冷冰冰的專業(yè)詞兒。
但Lars Reger看起來卻不是一個冷冷的人,采訪中最讓我印象深刻的不是他的產(chǎn)品描述,而是他如何講故事。他會用家人的經(jīng)歷來傳達對自動駕駛的思考,也會用生活化場景來描述對一項技術(shù)的理解,還會在談到自己的使命時強烈表達“要把一些創(chuàng)新思路復(fù)制到汽車行業(yè)“,顯得專業(yè)認真又感染力十足。
“汽車行業(yè)正在經(jīng)歷新一輪技術(shù)轉(zhuǎn)型。”Lars對此頗有感觸。
因為工作的關(guān)系,Lars經(jīng)常與Tier1和OEM打交道,以往他都是帶著產(chǎn)品去做介紹,而幾年前的某一天,一些頂級車企找到他尋求“如何做整車的搭建和設(shè)計”,Lars才意識到,汽車行業(yè)正在發(fā)生巨變。
這種巨變首先發(fā)生在消費者身邊。現(xiàn)在越來越多人坐在車里,期待汽車帶來的更多體驗,它是一輛交通工具,更是輪子上的智能終端,而這種體驗需要的是「車聯(lián)網(wǎng)」。
如果車聯(lián)網(wǎng)是未來汽車的大勢所趨,那么汽車制造商確實應(yīng)該在擰第一個螺絲的時候就要開始思考如何把「車聯(lián)網(wǎng)」裝進汽車里。
長期追蹤V2X動態(tài)的Lars自然想要抓住這一機遇。他回憶道,為了解決汽車廠商的這些困惑,過去兩三年內(nèi),恩智浦開展了大量的相關(guān)討論,考慮的就是如何幫助車企搭建一個智能系統(tǒng)。Lars特別提到恩智浦11月份最新推出的一種新型汽車UWB芯片——“汽車有了這款芯片,智能手機就有機會成為汽車的數(shù)字鑰匙”。UWB芯片最黑科技之處在于它的定位功能,區(qū)別于其他定位技術(shù)(如Wi-Fi、藍牙和GPS),UWB技術(shù)能夠讓汽車、手機和其他智能設(shè)備具備空間感知能力,相當于不僅僅給車主、手機、汽車共享了位置,還讓手機又get了一項“車鑰匙”新技能。UWB芯片一經(jīng)問世,很快便成為市場的香餑餑,促使了恩智浦、寶馬集團、大陸集團以及其他公司在車聯(lián)網(wǎng)聯(lián)盟(CCC)和IEEE合作研究UWB部署事項。
UWB芯片看似簡單的一個“數(shù)字鑰匙”的思路,其實是一個非常大的創(chuàng)新。舉個例子,比如A想要在周末借用一下B的車,那怎么交鑰匙是一個問題,面對面給鑰匙似乎有點麻煩,因為兩人不一定在同一個地方,但如果能做到像銀行交易一樣,B通過手機把電子鑰匙發(fā)送給A,那就省事兒多了,只要設(shè)置幾天的權(quán)限,A在手機上接收“臨時鑰匙”就可以去提車了,這樣一來就顛覆了鑰匙管理的做法。UWB應(yīng)用在汽車上,是一種汽車系統(tǒng)方面的創(chuàng)新,在安全方面也能最大程度防止汽車被盜;UWB應(yīng)用在手機上,就能實現(xiàn)更強大的連接功能,包括汽車、手機、鑰匙、密鑰等系統(tǒng)的融合。
說到這里,Lars欣慰之情溢于言表,他說這就是工作帶給他最有成就感的地方——“比較酷的一點是,我們可以把其他行業(yè)的一些創(chuàng)新思路復(fù)制到汽車行業(yè),也可以把汽車行業(yè)的用例推廣到其他市場。”
當被問到“自動駕駛芯片”的問題時,Lars坦言業(yè)界普遍有一個誤解——認為自動駕駛就是“輪子上的智腦”,實則不然。
理想中的自動駕駛系統(tǒng)是什么樣的?首先,它要能感知,也就是傳感;其次要能思考,隨時把智能駕駛的建議提供給汽車;第三,如果智腦太小而沒有辦法應(yīng)付的話,要有能力連接到云上,得到相應(yīng)的意見;最后,執(zhí)行器需要對其他的系統(tǒng)下發(fā)指令。如果沒有這樣的系統(tǒng),就不會形成自動駕駛的車。
與人類學開車一樣,自動駕駛技術(shù)的發(fā)展,也就是機器學習開車的過程,不但要用到「智腦」,也會用到「車身架構(gòu)(硬件、基礎(chǔ)設(shè)施)」。
所謂“智腦”,一些半導(dǎo)體廠商會開始搭建一個自動駕駛技術(shù)開發(fā)平臺,比如英偉達的DriveFI,恩智浦的Bluebox,平臺上布滿了各種各樣的AI芯片,接著就是大量的訓練,取得一定成果后再去復(fù)制和模擬好駕車員的開車習慣,走上一條“新司機”到“老司機”的蛻變之路。
我們不妨想象一下整個過程,一個懵懂的新司機,從學習交規(guī),到練車,再到考駕照,然后一年內(nèi)在老司機的監(jiān)督下開車上路,還會不停攝取其他司機的經(jīng)驗,最后自己變成一個老司機,是否聽起來的確是那么回事兒了?然而要實現(xiàn)這些還有很長一段漫漫長路,Lars談到這里雙手交叉:整個過程里,機器需要大量的數(shù)據(jù)為依托,更重要的是,需要引入「創(chuàng)造力分析」,比如堵車的時候,是繞過前車還是繼續(xù)等待?比如碰到障礙物的時候,是踩剎車還是避開?這些都需要AI在設(shè)計上具體問題具體分析。
總而言之,自動駕駛要做到這些,需要芯片廠商和Tier1/OEM廠商一起合作探索解決方案。
Lars總結(jié)經(jīng)驗,“與合作伙伴形成這樣一種搭建關(guān)系和溝通交流的平臺,對我們而言意義重大”。
究竟自動駕駛發(fā)展到哪個階段了呢?Lars熟練地介紹道,現(xiàn)階段L3級自動駕駛技術(shù)已經(jīng)相當成熟,一些國家已經(jīng)開始推動相關(guān)的立法進程,預(yù)計未來一兩年內(nèi)普及開來;而L4/L5級自動駕駛技術(shù),則至少還需要5年才能量產(chǎn)落地。
當然,他強調(diào)稱這里的“L3級自動駕駛”更多的是指“適用于高速公路的自動駕駛技術(shù)”,因為高速公路場景相對簡單,車流是通暢的,沒有行人,也沒有奇怪的路障。按照他的描述,當人類司機將車輛開上高速后,按下一個按鈕,即可開啟高速公路自動駕駛,可以解放雙手雙腳,待即將抵達出口時,車輛會提醒人類駕駛員進行接管,并將車輛開下高速。
“我的父親今年80歲了,他開車10公里沒什么問題,但是開500公里對他來說就比較吃力了,這時候L3級高速公路輔助功能就很有幫助。”Lars舉例之后總結(jié)道,L3對于家庭用戶比較有吸引力。
而至于L4/L5級自動駕駛技術(shù),情況相對復(fù)雜,首先城市里交通狀況不穩(wěn)定,其次技術(shù)(傳感器、電路系統(tǒng)和芯片)也存在挑戰(zhàn),另外社會監(jiān)管環(huán)境也是個問題。
Lars由此判斷,L4/L5級完全自動駕駛汽車將率先在中國落地,意想不到的是,他的這一判斷并不是根據(jù)技術(shù)或者法律,而是社會人文環(huán)境。
“例如我們在法國進行的路測,就發(fā)現(xiàn)很多熊孩子熊大人故意跑到自動駕駛車前面擋路,這時候車輛就不知道該怎么辦了,測試也沒辦法繼續(xù)了。”Lars分析道,“相比于歐洲各地,中國擁有嚴格的社會監(jiān)督環(huán)境,這種行為在中國可能會受到嚴厲的處罰。”
據(jù)Lars說,L4/L5級系統(tǒng)更適應(yīng)出租車公司這類群體,當然,這需要它的可靠性完全達標才會被人接受,而實現(xiàn)這一切至少需要5年以上。
正所謂事物的發(fā)展總是前進性與曲折性兼具,自動駕駛技術(shù)也一樣,它的發(fā)展中經(jīng)常伴隨著這樣那樣的問題。
據(jù)Lars描述,自動駕駛推進更關(guān)鍵的一個難點在于「傳感器」,這也是此前一些自動駕駛車禍的根源,傳感器太弱,對路上的“對象”產(chǎn)生了誤判。
因此自動駕駛車至少要配備三個類型的傳感器:第一類是駕駛員坐在車里,身體能感知的一些勢能、動能(如轉(zhuǎn)向和壓力);第二類是駕駛員能看到的視線范圍(它涉及激光雷達、雷達、攝像頭);第三類是人類目前不具備的功能,就是在視線以外感知車與車之間的通訊。
Lars接著分析道,隨著成像毫米波雷達的日漸成熟,5-8年后,攝像頭+成像毫米波雷達+V2X的感知方面,將有可能取代激光雷達。這是因為,激光雷達不僅貴,且存在一個致命缺點,即在日光下能看得清楚,但碰到雨天、雪天、霧天就看不清楚了;而好的攝像頭足以取代人眼視力,雷達一方面能夠做到在惡劣天氣環(huán)境下的視覺比人眼更好,另一方面與激光雷達運行在同一個光學傳感范圍內(nèi),替代不成問題。
對于此,業(yè)內(nèi)也有一些人持有類似觀點,最典型的就是埃隆·馬斯克,他也曾提出“要避免使用激光雷達系統(tǒng)”,通過不同的波長雷達、攝像頭、車與車之間的通信就能很好的結(jié)合。
通過Lars的講述,我們最終了解到,恩智浦不僅是全球最大的車載半導(dǎo)體供應(yīng)商,還是全球最重要的車載毫米波雷達收發(fā)芯片/處理芯片供應(yīng)商之一。
2015年,恩智浦與飛思卡爾合并之后就著手投入自動駕駛領(lǐng)域,計劃收購Marvell的藍牙和WiFi業(yè)務(wù),還自主研發(fā)了包括UWB在內(nèi)的多種技術(shù)……“這些技術(shù)儲備,讓恩智浦成為業(yè)界唯一一家能夠為汽車行業(yè)實現(xiàn)電動化、互聯(lián)以及安全自動駕駛提供相應(yīng)半導(dǎo)體技術(shù)和系統(tǒng)級解決方案支持的企業(yè),且我們能實現(xiàn)90%以上芯片的自研發(fā)和自生產(chǎn)。”
傳感器方面,恩智浦實現(xiàn)了雷達等技術(shù)上車,進而讓汽車擁有了ACC自適應(yīng)巡航(L1級自動駕駛)、ICA集成式智能巡航(L2級自動駕駛)等ADAS功能,再與傳感器收集的數(shù)據(jù)一起,進入到汽車的大腦里。比如大眾高爾夫8代最新的量產(chǎn)車,就能夠?qū)崿F(xiàn)上述第三類別的傳感。
說到這里,采訪已經(jīng)接近尾聲,Lars說還要趕往下一個行程——技術(shù)發(fā)展需要創(chuàng)新應(yīng)用,CTO一定要跟上。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務(wù)上驗證有效性。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會友,左手硬核科技,右手浪漫主義。