作者 | 金旺
欄目 | 具身資訊
2024年7月,年僅36歲的印奇開(kāi)啟了他的第二次創(chuàng)業(yè)。
第一次創(chuàng)業(yè),印奇和自己在清華姚班的兩位同學(xué)唐文斌、楊沐一起創(chuàng)立的曠視科技,曠視科技后來(lái)成長(zhǎng)為國(guó)內(nèi)第一批“AI四小龍”,三位創(chuàng)始人也成了中國(guó)AI領(lǐng)域關(guān)鍵人物。
第二次創(chuàng)業(yè),印奇在2024年成立江河順?biāo)?,江河順?biāo)熳鲀r(jià)24.3億元受讓吉利旗下公司所持有的力帆科技部分股份后,力帆科技更名為千里科技,印奇于同年任職千里科技董事長(zhǎng)。
從人工智能明星企業(yè)轉(zhuǎn)入智能駕駛賽道算不上跨界,但對(duì)于印奇而言,這仍是一次新的嘗試,一次憑借AI改變汽車行業(yè)的嘗試。
3月3日,繼在上海GDC 2025上與吉利汽車、階躍星辰聯(lián)合官宣打造汽車全域智能后,在吉利AI智能科技發(fā)布會(huì)上,千里科技董事長(zhǎng)印奇作為主咖,在發(fā)布會(huì)上闡述了他的“AI+車”理念。
01 2025,“AI+車”元年
在汽車圈,吉利是在大模型領(lǐng)域早起的那個(gè)人。
早在2021年,吉利就部署了AI技術(shù),并在行業(yè)還不明朗時(shí)啟動(dòng)了基礎(chǔ)大模型的研究。
吉利汽車集團(tuán)CEO淦家閱在發(fā)布會(huì)上指出,“目前吉利已經(jīng)將AI技術(shù)應(yīng)用到了架構(gòu)、動(dòng)力、座艙、底盤等汽車全域和全價(jià)值鏈中,這讓吉利成為了AI造車第一車企。”
要成為AI造車第一車企,只有吉利汽車自己的研發(fā)力量是不夠的,于是,吉利基于星睿智算中心2.0成立了智能汽車算力聯(lián)盟。
作為吉利生態(tài)戰(zhàn)略合作伙伴,以及吉利汽車智駕系統(tǒng)技術(shù)供應(yīng)商,千里科技自然也是這一聯(lián)盟中的一員。
作為千里科技董事長(zhǎng),印奇認(rèn)為,人工智能技術(shù)進(jìn)步與汽車產(chǎn)業(yè)發(fā)展有著共振。
關(guān)于人工智能與汽車產(chǎn)業(yè)的共振,印奇特別提到了三個(gè)時(shí)間節(jié)點(diǎn):
第一個(gè)節(jié)點(diǎn),2017年,以Transformer為代表的全新AI技術(shù)架構(gòu)正式推出,一年后,Waymo推出了Robotaxi第一個(gè)商用服務(wù),接著,特斯拉在2020年上線了FSD Beta版本;
第二個(gè)節(jié)點(diǎn),2021年,吉利發(fā)布“智能吉利2025戰(zhàn)略”、打造了“一網(wǎng)三體系”,一年后,OpenAI發(fā)布了震驚全球的ChatGPT,接著,特斯拉在2023年發(fā)布了首次實(shí)現(xiàn)純視覺(jué)端到端智駕架構(gòu)的FSD V12;
第三個(gè)節(jié)點(diǎn),2025年,DeepSeek R1全球開(kāi)源,再次引爆全球人工智能領(lǐng)域,緊隨其后,吉利與階躍星辰聯(lián)合開(kāi)源兩款多模態(tài)大模型,與此同時(shí),今年也是“智能吉利2025戰(zhàn)略”的收官之年,更多智駕和座艙產(chǎn)品即將涌現(xiàn)。
正是藉由人工智能技術(shù)突破,以及在汽車產(chǎn)業(yè)中的應(yīng)用情況,印奇認(rèn)為,2025年是“AI+車”的元年。
02 “AI+車”的三個(gè)趨勢(shì)
2024年,掀起這次人工智能浪潮的OpenAI,就AGI(通用人工智能)技術(shù)提出了五級(jí)分級(jí)架構(gòu),在這一架構(gòu)中,人工智能技術(shù)被劃分為五個(gè)階段,分別為:
L1:聊天機(jī)器人(ChatBots),具有對(duì)話能力的AI;
L2:推理者(Reasoners),可以像人類一樣解決問(wèn)題的AI;
L3:智能體(Agents),不僅能思考,還可以采取行動(dòng)的AI系統(tǒng);
L4:創(chuàng)新者(Innovators),可以協(xié)助發(fā)明創(chuàng)造的AI;
L5:組織者(Organizations),可以完成組織工作的AI。
印奇認(rèn)為,當(dāng)前人工智能正在從L2的推理者向L3的智能體本質(zhì)跨越,2025年也會(huì)成為智能體爆發(fā)的一年。
實(shí)際上,無(wú)論是智能語(yǔ)音系統(tǒng),還是多模態(tài)大模型,在過(guò)去幾年已經(jīng)逐漸被用到了汽車上,乃至座艙中。
而就現(xiàn)在多模態(tài)智能體發(fā)展趨勢(shì)下,印奇提出了他認(rèn)為的“AI+車”三大趨勢(shì):
第一個(gè)趨勢(shì),超自然人機(jī)交互的誕生。
從當(dāng)年P(guān)C上的GUI發(fā)展到移動(dòng)互聯(lián)網(wǎng)時(shí)代的Touch UI,如今我們?cè)谄?,乃至更多?chǎng)景下,正在邁入一個(gè)超自然的Ultra Nature UI交互形態(tài)。
千里科技與吉利正在重新定義的具備超自然對(duì)話、AgentOS、跨域協(xié)同的下一代座艙系統(tǒng),預(yù)計(jì)將在今年內(nèi)發(fā)布,并在銀河品牌車上上線。
第二個(gè)趨勢(shì),自動(dòng)駕駛及自動(dòng)執(zhí)行的全面落地。
機(jī)器人領(lǐng)域機(jī)械臂的VLA模型,以及世界生成模型的高速發(fā)展,未來(lái)將會(huì)有越來(lái)越多機(jī)器人應(yīng)用場(chǎng)景和自動(dòng)執(zhí)行場(chǎng)景迎來(lái)爆發(fā), 而汽車將會(huì)是最趨向機(jī)器人,也是最大規(guī)模的機(jī)器人落地場(chǎng)景。
吉利聯(lián)合生態(tài)企業(yè)推出的千里浩瀚,將作為具備L3量產(chǎn)能力的解決方案今年搭載到銀河品牌車型上。
第三個(gè)趨勢(shì),車聯(lián)網(wǎng)大模型量級(jí)升維。
從模型的數(shù)據(jù)量來(lái)看,目前智駕大模型大約會(huì)用到1000萬(wàn)個(gè)視頻片段,但是人工智能基礎(chǔ)大模型會(huì)用到10億個(gè)視頻片段;
從模型的物體識(shí)別類別來(lái)看智能駕駛識(shí)別的障礙物類別在百級(jí),大部不能被識(shí)別的障礙物被簡(jiǎn)單地歸類為通用可移動(dòng)/不可移動(dòng)障礙物,而如今最先進(jìn)的多模態(tài)大模型能夠識(shí)別的物體種類能夠能達(dá)十萬(wàn)級(jí)別。
真正的AI大模型實(shí)際上比現(xiàn)在車上的AI模型先進(jìn)1-2代,如果能將大模型應(yīng)用到車上,這將會(huì)智能汽車帶來(lái)巨大潛力。
印奇認(rèn)為,汽車將會(huì)在未來(lái)化身為一個(gè)超級(jí)智能體,乃至一個(gè)“出行智慧生命體”。
這或許正是長(zhǎng)于人工智能技術(shù)的印奇,第二次創(chuàng)業(yè)進(jìn)入智能汽車賽道,看到的那個(gè)充滿誘惑力的未來(lái)。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。
關(guān)注智造、硬件、機(jī)器人。