av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃,關(guān)注公眾號

  • 科技行者

  • 算力行者

見證連接與計算的「力量」

首頁 智元機器人如何跨越“莫拉維克鴻溝”?

智元機器人如何跨越“莫拉維克鴻溝”?

2025-09-05 14:38
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-09-05 14:38 ? 高飛

作者|高飛

談具身智能,可以從一個我們都習以為常的現(xiàn)象說起。

在過去的幾年里,我們手機里的AI,聰明得簡直讓人害怕。你給它一段話,它能給你寫出莎士比亞風格的十四行詩;你讓它分析財報,它能瞬間標出所有的風險點。在那個由0和1構(gòu)成的、零摩擦的數(shù)字世界里,它們仿佛無所不能。很多人在問,通用人工智能(AGI)是否已經(jīng)近在咫尺了。

然后,你開始試想讓這個“超級大腦”去做一件最簡單的事,比如擰開一個礦泉水瓶蓋,或者把桌上散亂的樂高積木搭起來。

這時候,事情就變得不同了。在賽博空間呼風喚雨的智能體,對此并無能為力。

這就像你發(fā)現(xiàn)一個能心算微積分的天才,并不會系鞋帶。

這個現(xiàn)象其實早有個名字,叫“莫拉維克悖論”。早在1980年代,機器人學家莫拉維克就發(fā)現(xiàn)了:讓計算機下棋容易,讓它走路卻難如登天。這揭示了一個我們長期忽視的真相:我們?nèi)祟惸切┝曇詾槌5?ldquo;手感”、“分寸”,這些被中科院呂本富教授稱為“默會知識”的東西,才是智能最核心的部分。

但需求往往是創(chuàng)新之母。

智元機器人如何跨越“莫拉維克鴻溝”?

如果說過去幾年的AI浪潮,只是在“信息”層面打轉(zhuǎn),那么現(xiàn)在,我們正站在一個新時代的門檻上,即“行動”的時代,這就是具身智能(Embodied AI)。它要解決的,就是讓AI從屏幕后面走出來,真正地去感知、去交互、去“干活”。而這項技術(shù)的皇冠明珠,自然是“人形機器人”。

這并不是一次簡單的技術(shù)升級,在人類歷史的長河中,總有那么一些時刻,技術(shù)的發(fā)展從量變走向質(zhì)變,從而徹底改變了我們與世界的關(guān)系。就像蒸汽機解放了體力,計算機解放了腦力,而人形機器人,不僅試圖將兩者重新合二為一,而且是人類所熟悉的方式,在人類生活、工作的環(huán)境。

2025年8月21日,上海。一群見證了中國互聯(lián)網(wǎng)三十年風雨的“IT老友會”老兵,決定去探訪這場“行動革命”的一個前沿陣地:智元機器人。

智元機器人如何跨越“莫拉維克鴻溝”?

合作伙伴大會晚宴,智元機器人變身酒吧工作人員

這家公司成立才兩年半,但通過交流,大家的感知是:某種程度上,智元似乎 “一出生就是參天大樹”。他們當天正好在開第一屆合作伙伴大會。所以這次探訪,也就成了一次對新技術(shù)生態(tài)的集體窺探。

現(xiàn)實世界的“復仇”:為什么快,是唯一的生存法則

進入物理世界,AI遇到的第一個敵人,不是算力不足,而是現(xiàn)實世界本身。

在數(shù)字世界里,復制粘貼一個文件,瞬間完成,完美無缺。但在物理世界里,讓機器人去拿一個杯子,它要考慮杯子的材質(zhì)、重量、摩擦力、光線變化,甚至桌子輕微的晃動?,F(xiàn)實世界充滿了不確定性和“摩擦力”。

在研討會上,大家對此都深有感觸。資深媒體人、人文財經(jīng)觀察家、秦朔朋友圈發(fā)起人秦朔直言,想窮盡物理世界的所有場景?“極為艱難”。

著名學者、觀察家、新物種研究院院長吳伯凡則提到“反摩爾定律”(Eroom's Law)。我們都知道摩爾定律:芯片性能每18個月翻一倍,價格降一半。但在物理世界,事情可能正好相反:越接近目標,付出的代價可能越大。吳老師警告說:“你以為都快近在眼前的那一刻一步之遙的時候,可能花的成本是最多的,甚至功虧一簣。”

這就像攀登珠峰,最后的幾百米,才是最艱難、最危險的路程。

面對現(xiàn)實世界的這種“復仇”,如果你還慢悠悠地在實驗室里搞理論研究,等著一個完美的通用大模型從天而降,那基本上就出局了。

所以,智元的策略是什么?一個字:快。

快到什么程度?智元董事長鄧泰華給我們透了個底:“我們是2023年年初創(chuàng)立的公司,但是今年(2025年)出貨量大概有5000多臺”,他又補了一句“其實去年四季度智元機器人才剛剛開始量產(chǎn)”。

兩年半,從零到5000臺量產(chǎn)。在重資產(chǎn)、長周期的機器人行業(yè),這個速度無疑快得驚人。智元機器人CMO邱恒說,他們是“全球第一個實現(xiàn)一千臺人形機器人量產(chǎn)的公司”,而且已經(jīng)在有些場景開始賺錢了。

就在寫下這些文字的時候,無意中刷到中國招標投標公共服務(wù)平臺的公示:湖北人形機器人創(chuàng)新中心機器人采購及安裝項目的評標結(jié)果中,智元機器人成為第一中標候選人,投標報價超過三千萬。

但這種速度,對智元來說,不能單純視為一種“搶占市場”的行動?;蛟S,將其稱為具身智能“生存法則”會更合適。

因為具身智能的學習方式和大語言模型完全不同。大語言模型可以靠抓取網(wǎng)上的海量文本來學習,但具身智能不行。它必須在真實的物理世界里摸爬滾打,才能積累經(jīng)驗。如果說數(shù)據(jù)是燃料,機器人本體是采集數(shù)據(jù)的關(guān)鍵工具。

一言以蔽之:部署的機器人越多,跑的場景越多,積累的數(shù)據(jù)就越多,模型才會越聰明。

這就是“數(shù)據(jù)飛輪”。

智元法則,自然是通過極致的速度,讓這個飛輪率先轉(zhuǎn)起來。秦朔對此評價得很到位,有些人還是“小實驗室”,智元已經(jīng)是一個“超級實驗工廠”。

那么,智元憑什么能這么快?

在交流中,浙大的方興東教授一語道破:“這可能是智元的團隊基因。”

在研討會上,邱恒展示了一張圖,人形機器人產(chǎn)業(yè)鏈的約40項關(guān)鍵技術(shù)中,智元自研或合作定義的超過30項,涉及從核心零部件(關(guān)節(jié)、靈巧手)到大模型算法。只有少數(shù)部件,是市場直接采購而來。

邱恒解釋:“因為整個這個產(chǎn)業(yè)還沒有那么長的發(fā)展時間,很多技術(shù)原本并不成熟,僅依賴市面上的東西造產(chǎn)品,很難商用化。”

顯然,這是那種“自己的命運必須掌握在自己手里”的思維方式。這種系統(tǒng)性的作戰(zhàn)能力,讓智元像一支裝備精良的正規(guī)軍,在物理世界的“叢林”里,殺出了一條新路,在可能應該糾結(jié)怎么造“槍”的時候,在前線“開火”。

“一腦多形”:機器人應該長什么樣?

在談?wù)摼呱碇悄軉栴}時,一個經(jīng)久不衰的問題是:我們到底在談?wù)撌裁葱螒B(tài)的物種?人形態(tài)是否是一種必須?

吳伯凡給出了一個非常深刻的定義:“你的身體長什么樣,在很大程度上,它反映的不是你的身體,是反映你的空間。”

這話聽起來有點哲學,但其實很好理解。蝙蝠的樣子,是因為它要在黑暗中用超聲波定位;魚的外觀,是因為它要在水里游。身體的形態(tài),決定了物種在空間里的自由度。

所以,雖然智元機器人的主力產(chǎn)品是“人形機器人”,但是并沒有在現(xiàn)階段強行要求所有機器人都長得像人。在當前的條件下,用單一的“人形”去適應所有場景,既不經(jīng)濟,也不高效。

智元的思路很清晰,那就是“一腦多形”:一個超級大腦,可以搭載到不同的身體上。

在合作伙伴大會上,智元的聯(lián)合創(chuàng)始人兼CTO彭志輝,大家可能更熟知他的網(wǎng)絡(luò)ID“稚暉君”,詳細介紹了他們的“1+3”戰(zhàn)略:“1”是本體,“3”是三大智能(運動、交互、作業(yè))。

基于這個統(tǒng)一的技術(shù)底座,智元變出了一個“機器人家族”。稚暉君總結(jié)得非常精辟:“遠征走出去,精靈干起來,靈犀動人心”。

  • 1、遠征(Yuanzheng):那個最像人的家伙。

“遠征”系列就是我們印象中的全尺寸人形機器人。它的任務(wù)是探索技術(shù)的邊界。

在會上的遠征A2視頻中,我們能看到它已經(jīng)可以在草地、碎石、臺階上穩(wěn)定行走了。這背后是技術(shù)的巨大突破。稚暉君提到,他們正在從控制下半身移動,轉(zhuǎn)向“全身控制”。“基于Sim-to-Real(仿真到現(xiàn)實)的這種強化學習的泛化自然步態(tài)上面,現(xiàn)在已經(jīng)取得了很大的突破。”

這意味著機器人不僅能走,還能跳舞,能做復雜的全身協(xié)調(diào)動作,通過了控制精度的極致考驗。

同時,遠征也是下一代最重要的“交互終端”。就像鼠標定義了PC,觸摸屏定義了手機,未來我們和機器人的交互,就應該像人和人一樣自然。

“我們需要賦予機器人一些性格,能夠讓它有足夠的多樣性,不同的機器人千人千面。”為了實現(xiàn)這一點,遠征A2支持全身定制,不僅可以換外殼,還可以定制性格和音色。他們甚至讓A2去代言百事可樂。好處顯而易見?,F(xiàn)場專家開玩笑地說,這是一個“永不翻車”的明星。

  • 2、精靈(Jingling):那個真正干活的家伙。

如果說遠征思考技術(shù)邊界問題,那么精靈則是思考生產(chǎn)力問題。

“機器人到底能不能真正的替人去干活,我們精靈的產(chǎn)品就是為此而生。”稚暉君在大會發(fā)言中直言不諱,“人形并不是一個萬能的形態(tài)。”

在工廠流水線、物流分揀這些需要長時間移動和精細操作的場景,雙足人形機器人太慢,能耗也高。所以,“精靈”長得有點像一個移動的吧臺,下面是輪式底盤,上面有兩只手臂。

精靈的核心價值在于“數(shù)據(jù)”。傳統(tǒng)的工業(yè)機器人都是預先編程好的,只能做固定的動作。但現(xiàn)在的柔性制造需要機器人能隨機應變。要讓機器人學會“干活”,必須從真實數(shù)據(jù)中學習。

所以,精靈首先是一個高效的數(shù)據(jù)采集平臺。它配備了VR、動捕等遙操作設(shè)備,讓人類可以遠程操作它,采集真實的動作數(shù)據(jù)。這些數(shù)據(jù),就是訓練具身大模型的“燃料”。

目前,智元在作業(yè)智能方面定義了G1到G5五個等級(類似自動駕駛的L1到L5)。精靈在一些場景已經(jīng)達到了可以商業(yè)化落地的G2級別。而即將發(fā)布的精靈G2,將具備高精度力控,能干較為精細的工作,比如插接電路板。

  • 3. 靈犀(Lingxi):那個讓人心動的“作品”。

“靈犀”是智元最新的產(chǎn)品線,身高1.3米,像個孩子。但你可別把它當玩具。稚暉君說,這是他們目前“運動能力最強,體驗最流暢的一款產(chǎn)品”。

靈犀X2的自由度(關(guān)節(jié)數(shù)量)高達42個,比很多全尺寸機器人都多。它專為交互設(shè)計,跳舞極其流暢自然。它在網(wǎng)上的視頻已經(jīng)刷屏了,充分證明了機器人在提供“情緒價值”方面的潛力。

  • 4. X-Lab的驚喜:未來形態(tài)。

在發(fā)布會的最后,稚暉君還放出了一個“One More Thing”——X2-W。這是智元機器人實驗室X-Lab的心作品。

它長得像是把靈犀的上半身裝在了一個輪式底盤上。W代表Wheel(輪子)和Work(工作)。它的目標是成為低成本作業(yè)智能的標桿,未來可能進入家庭,幫我們做家務(wù)。

“一腦多形”的策略,體現(xiàn)了智元務(wù)實的一面。他們沒有陷入“100%復刻人形”的教條,而是根據(jù)場景需求,選擇最優(yōu)的“身體”形態(tài)。這讓他們能夠快速切入不同的市場,實現(xiàn)商業(yè)化的落地。

操作系統(tǒng)“暗戰(zhàn)”:為什么要有“第二選擇”?

如果我們把具身智能比作一次“大航海”,那么機器人本體就是船,而操作系統(tǒng)(OS)就是羅盤和航海圖。

在智元成立之初,他們做了一個讓外界非常意外的決定:自研原生的操作系統(tǒng)“靈渠OS”(Lingqu OS)。

目前全球機器人行業(yè)普遍使用的是ROS(Robot Operating System)。ROS起源于美國學術(shù)界,后來被谷歌收購。既然已經(jīng)有了現(xiàn)成的ROS,智元干嘛還要費力不討好地“重復發(fā)明輪子”?

這背后的故事,比技術(shù)本身份量更重。

  • 1、戰(zhàn)略自覺。

“我們的團隊過去這么多年做操作系統(tǒng),就很清楚這個商業(yè)邏輯。”鄧泰華在研討會上說。它可能在未來某一天,成為決定產(chǎn)業(yè)命運的關(guān)鍵。

鄧泰華判斷,具身智能是一個大賽道,市場空間可能達到“智能手機的數(shù)量乘以單車的價格”。而且,在這個賽道上,中國擁有得天獨厚的優(yōu)勢(供應鏈、場景、數(shù)據(jù))。

因此智元機器人的判斷是:在這樣一個關(guān)乎未來的戰(zhàn)略性產(chǎn)業(yè)中,如果不掌握操作系統(tǒng)的“根”,那無異于將自己的命脈交到別人手中。

“一開始就要考慮好這個軟件生態(tài)的根。”鄧泰華說。構(gòu)建一個“第二選擇”,不是一種選擇,而是一種必然。

  • 2、為未來而生的“新物種”。

除了戰(zhàn)略布局考慮,對智元機器人而言,自研OS也是技術(shù)發(fā)展的必然要求。傳統(tǒng)的ROS并不是為人形機器人和具身智能時代設(shè)計的。

但是,“靈渠OS”是一個為未來而生的“新物種”。智元產(chǎn)品總監(jiān)胡曠介紹,它是“一個原生的支持具身智能的操作系統(tǒng)”。

它的設(shè)計目標很明確:南向(連接硬件),更好地適配人形機器人這種高自由度的本體;北向(連接應用),更好地支持具身智能大模型和各種智能應用。它要解決的是智能化、群體協(xié)同、云邊端融合這些新挑戰(zhàn)。

  • 3、開源的“陽謀”。

不過,做一個操作系統(tǒng)容易,做一個成功的生態(tài)卻難如登天。智元為“靈渠OS”規(guī)劃了一條務(wù)實的開源路徑。

首先,從增量市場切入。

“我們從具身智能開始做,不去碰工業(yè)機器人,不去碰原來老的存量。”鄧泰華表示。他們不和ROS在傳統(tǒng)的工業(yè)機械臂領(lǐng)域正面競爭,而是專注于全新的、快速增長的人形機器人市場。

其次,兼容并蓄。

智元采用了“雙棧”策略。“我們也兼容ROS。 ROS已有的生態(tài)、海外的生態(tài),我們也可以無縫地接進來,我并不排斥。”這種開放的態(tài)度,有助于吸引更多的開發(fā)者,平滑地過渡到原生生態(tài)。

第三,產(chǎn)業(yè)共有。

智元計劃在2025年底將“靈渠OS”正式開源,并將代碼捐贈給開源基金會。通過自身的規(guī)?;瘧茫髂陰兹f臺全部使用靈渠OS)來帶動生態(tài)發(fā)展。

其實,“靈渠”這個名字本身就很有深意。靈渠是秦始皇時期修建的偉大工程,溝通了長江和珠江水系,奠定了中華版圖的根基。智元的“靈渠OS”,也承載著溝通南北、構(gòu)建自主生態(tài)的宏大愿景。

從“編程”到“創(chuàng)作”:誰能激活真正的生態(tài)?

有了船,有了羅盤,但要真正征服星辰大海,還需要無數(shù)的水手和探險家。這就是生態(tài)。

“生態(tài)”這個詞在中國科技界已經(jīng)被說濫了。我們見過太多失敗的例子。吳伯凡老師一針見血地指出:“那種‘我來坐莊,大家來陪我玩兒’的思維,是偽生態(tài)。”

真正的生態(tài),需要一種“半成品”思維。就像蘋果提供iPhone和App Store,然后讓全球的開發(fā)者去創(chuàng)造應用一樣。廠商提供基礎(chǔ)平臺,然后和開發(fā)者共同定義未來。

那么,在具身智能時代,如何激活一個真正的生態(tài)?智元在發(fā)布會上展示的一個全新的“靈創(chuàng)平臺”。它可能預示著一個思路的轉(zhuǎn)變:從“編程”到“創(chuàng)作”。

  • 1、跨越開發(fā)的“死亡之谷”。

目前,機器人應用開發(fā)的最大障礙是門檻太高。稚暉君在演講中提到了一個痛點:你在網(wǎng)上看到很多機器人跳舞的視頻,很靈活,很生動,但翻來覆去就那么幾段動作。

而讓機器人做一個復雜的動作,需要非常專業(yè)的知識,比如強化學習、模仿學習。一般人根本搞不定,只能等廠商更新。這種高門檻,阻礙了應用的創(chuàng)新。

“靈創(chuàng)平臺”的目標,就是把機器人開發(fā)的權(quán)力,從專業(yè)人士手中解放出來,交到普通用戶手中。

  • 2、像剪視頻一樣“玩”機器人。

在現(xiàn)場,稚暉君的演示中。伙伴們看到,這個平臺(支持電腦和手機)的界面就像一個視頻編輯軟件。你可以在動作庫里選動作,在時間軸上剪輯,甚至可以調(diào)整每一個關(guān)節(jié)的角度。

甚至,你可以上傳一段音頻,比如一首歌,平臺內(nèi)置的AI模型可以根據(jù)音樂的情緒,自動生成匹配的肢體動作。“所有的動作都是生成式的”,稚暉君強調(diào)。你還可以在歌詞的關(guān)鍵位置,插入特定的動作指令(比如“指向前方”),選擇動作的風格。

整個過程不需要寫一行代碼。這極大地降低了機器人內(nèi)容創(chuàng)作的門檻。

  • 3、改變游戲規(guī)則的瞬間。

稚暉君還在會場進行了另一個演示。讓同事用手機隨便錄了一段他自己的動作視頻。然后,他把這段普通的2D視頻上傳到平臺。平臺通過AI模型,從2D視頻中提取出3D的動作數(shù)據(jù),然后通過Retargeting(動作重定向)技術(shù),把人的動作映射到機器人身上。

很快,臺上的機器人靈犀X2,就完美復現(xiàn)了稚暉君剛剛做的動作。

“它不需要動捕的設(shè)備,不需要VR設(shè)備,所有設(shè)備都不需要,只需要有一臺手機。”稚暉君說。

每一個偉大的技術(shù)時代,都需要一個“普惠化”過程。

傳統(tǒng)的動作采集需要昂貴的設(shè)備和復雜的系統(tǒng)。而智元的技術(shù),讓任何一個普通人,都可以通過手機拍攝,來“教”機器人做新的動作。

  • 4、開啟具身智能的UGC時代。

“靈創(chuàng)平臺”的初心,是開啟一個人形機器人的UGC(用戶生成內(nèi)容)時代。

智元機器人如何跨越“莫拉維克鴻溝”?

稚暉君把它和快手的起源做了類比:“快手的前身其實是一款軟件,叫做快手GIF,最終是演變?yōu)楝F(xiàn)在一個短視頻平臺的巨頭。那我覺得說不定未來我們自己的靈創(chuàng)平臺也會成為一個(偉大)產(chǎn)品的雛形。”

確實,當用戶不僅僅是使用者,而是創(chuàng)造者時,生態(tài)才真正具有了生命力。用戶可以根據(jù)自己的需求,快速生成機器人的動作和行為,并在社區(qū)中分享。

長跑者的耐心:等待“奇點”的正確姿勢

盡管智元展現(xiàn)了驚人的速度和宏大的愿景,但IT老友會的資深專家,在興奮之余,也保持了必要的冷靜。一個繞不開的問題是:具身智能的“DeepSeek時刻”(或ChatGPT時刻)到來了嗎?

大家的意見是:還沒有。從信息到行動的跨越,注定是一場漫長的征途。

葦草智酷段永朝老師提醒,我們要警惕“樂觀情緒”,對爆發(fā)點的精確預測往往反映了內(nèi)心的焦躁。財經(jīng)作家陸新之老師也提到了幾十年前科幻小說《小靈通漫游未來》的例子,提醒我們技術(shù)發(fā)展的不可預測性。我們這一代人已經(jīng)被“爽約”過一次了,希望下一代人不要再失望。

這種審慎,是對產(chǎn)業(yè)規(guī)律的敬畏。

構(gòu)建生態(tài),需要“快變量”和“慢變量”的結(jié)合。

“靈創(chuàng)平臺”是“快變量”,能迅速激發(fā)創(chuàng)造力。但要構(gòu)建一個真正有護城河的生態(tài),還需要在“慢變量”上下功夫。

回到那個終極問題:具身智能的“奇點”何時到來?

呂本富教授認為,關(guān)鍵在于“涌現(xiàn)能力什么時候呈現(xiàn)”。他正在研究如何通過數(shù)學模型來預測這個“相變”點。

行行AI創(chuàng)始人李明順則認為,需要一個“超級應用”。“一定是要有一個超級應用,所有人都能接受、能夠用到”

或許,具身智能的“DeepSeek時刻”不會像大語言模型那樣突然降臨。它更可能是一個漸進的過程,在不同的場景中逐次爆發(fā)。

智元的策略,是通過快速的規(guī)?;渴穑铀贁?shù)據(jù)飛輪的運轉(zhuǎn),以期早日實現(xiàn)“一句頂一萬句”(一個機器人學會,所有機器人都學會)的智能涌現(xiàn)。這是在不確定性中尋找確定性的現(xiàn)實路徑。

前路依然漫長,挑戰(zhàn)依然巨大。物理世界的“摩擦力”不會輕易消失,生態(tài)的構(gòu)建需要時間去沉淀。

但正所謂“問渠哪得清如許,為有源頭活水來。”如“靈渠”之寓意所示,IT老友們也達成了另一個共識:智元以及更多的中國機器人企業(yè),如能在這場“開物”之旅中,為整個具身智能產(chǎn)業(yè)注入源源不斷的“活水”,那么 “行動智能”的機器人新紀元也不遠矣。

分享至
0贊

好文章,需要你的鼓勵

推薦文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-