作者| 金旺
欄目| 具身資訊
近日,在民營(yíng)企業(yè)座談會(huì)上,宇樹科技創(chuàng)始人王興興指出,“今年年底之前,整個(gè)AI的人形機(jī)器人會(huì)達(dá)到一個(gè)新的量級(jí)。”
作為國(guó)內(nèi)人形機(jī)器人明星企業(yè),在2024年9月完成C輪融資后,宇樹科技估值已經(jīng)突破80億元。
不過(guò),宇樹科技的人形機(jī)器人真正在大眾層面得到廣泛認(rèn)知,是在今年春晚上。
在今年春晚上,宇樹科技16臺(tái)人形機(jī)器人H1與新疆藝術(shù)學(xué)院舞蹈演員表演的舞蹈節(jié)目《秧BOT》,作為今年春晚的特色之一,迅速讓人形機(jī)器人闖入大眾視野。
與此同時(shí),人形機(jī)器人在人工智能技術(shù)加持下,確實(shí)在以肉眼可見的速度發(fā)生著改變。
01 機(jī)器人跳舞太“絲滑”,被質(zhì)疑為AI生成
近日,一個(gè)宇樹人形機(jī)器人G1的跳舞視頻在網(wǎng)上爆火,在視頻中,從機(jī)器人跳舞的穩(wěn)定性、流暢度,以及自然程度上來(lái)看,都很難想象是現(xiàn)階段人形機(jī)器人能夠?qū)崿F(xiàn)的能力。
畢竟,宇樹人形機(jī)器人在春晚舞臺(tái)上還曾因被舞蹈演員“扶著”下臺(tái)被主持人調(diào)侃。
這段人形機(jī)器人跳舞視頻發(fā)布后,在視頻平臺(tái)上被算法識(shí)別并自動(dòng)打上了“疑似使用AI技術(shù)生成”的提醒標(biāo)簽。
為了證明人形機(jī)器人跳舞的真實(shí)性,宇樹科技官方昨日在視頻平臺(tái)上又更新了一個(gè)視頻,視頻中,宇樹G1跳的依然是之前的舞蹈,不同的是,鏡頭側(cè)面放置了一面全身鏡實(shí)時(shí)顯示周邊環(huán)境,并時(shí)不時(shí)由旁邊的員工給他丟個(gè)球、來(lái)兩下,進(jìn)行干擾。
在這則視頻中,宇樹科技官方也對(duì)上一個(gè)視頻中提到的“算法升級(jí),任意舞蹈任意學(xué)”的說(shuō)法給出了解釋:
“最近幾天剛開發(fā)好的功能,還沒(méi)有推送給客戶,不同型號(hào)版本的機(jī)器人功能也有差異。”
這一方面證實(shí)了機(jī)器人跳舞的真實(shí)性,另一方面也對(duì)客戶手中的機(jī)器人沒(méi)有這個(gè)功能給出了一個(gè)交代。
據(jù)悉,宇樹科技的人形機(jī)器人在今年登上春晚后不久,就曾直接在京東平臺(tái)上開售H1和G1兩個(gè)型號(hào)的人形機(jī)器人,前者售價(jià)65萬(wàn)元,預(yù)計(jì)60天交貨,后者售價(jià)9.9萬(wàn)元起售,預(yù)計(jì)45天交貨。
然而,這兩款產(chǎn)品在上線不久后就進(jìn)行了下架,如今依然需要通過(guò)官方渠道進(jìn)行購(gòu)買。
值得注意的是,宇樹科技這款人形機(jī)器人此前在京東線上頁(yè)面顯示整機(jī)重約35kg,身高127cm,續(xù)航為2—4小時(shí),主要面向場(chǎng)景為娛樂(lè)陪伴。
對(duì)于希望在2025年實(shí)現(xiàn)量產(chǎn)的人形機(jī)器人產(chǎn)業(yè)而言,面向消費(fèi)市場(chǎng)的娛樂(lè)陪伴場(chǎng)景,顯然是一個(gè)更廣闊的量產(chǎn)市場(chǎng)。
不過(guò),王興興在近日接受媒體采訪時(shí)指出:
“今年年底之前,整個(gè)AI(驅(qū)動(dòng))的人形機(jī)器人會(huì)達(dá)到一個(gè)新的量級(jí),如果順利的話,諸如服務(wù)業(yè)、工業(yè)等基礎(chǔ)場(chǎng)景到明后年就可以推起來(lái)了,但家用(場(chǎng)景)會(huì)慢一點(diǎn),因?yàn)榧矣脤?duì)安全性的要求更高,需要技術(shù)相對(duì)更成熟一點(diǎn)。”
02 人形機(jī)器人產(chǎn)業(yè)繼續(xù)競(jìng)速
在宇樹人形機(jī)器人登上春晚,馬斯克號(hào)稱Optimus將要量產(chǎn)的2025年,人形機(jī)器人仍在競(jìng)速。
就在近日,我們看到,美國(guó)人形機(jī)器人明星企業(yè)Apptronik官宣融資3.5億美元(約25.5億元),國(guó)內(nèi)也有初創(chuàng)公司靈寶CASBOT完成了億元天使輪融資。
在技術(shù)迭代方面,逐際動(dòng)力近日發(fā)布了LimX VGM具身機(jī)器人操作算法,據(jù)官方公開資料顯示,這是一個(gè)基于視頻生成大模型的具身操作算法,通過(guò)人類操作視頻數(shù)據(jù)對(duì)現(xiàn)有的視頻生成大模型進(jìn)行后訓(xùn)練,僅需將場(chǎng)景圖片和操作任務(wù)指令作為提示Prompts,即可實(shí)現(xiàn)任務(wù)理解與拆分、物體操作軌跡生成以及機(jī)器人操作執(zhí)行的全流程,全過(guò)程零真機(jī)樣本數(shù)據(jù),并且可實(shí)現(xiàn)多平臺(tái)泛化。
加速進(jìn)化Booster T1也在近日公開了耐用性和撞擊測(cè)試視頻,在官方公開的視頻中,Booster T1人形機(jī)器人在表演完“胸口碎大石”后,依然可以再次起身。
不過(guò),在這一系列人形機(jī)器人企業(yè)融資、技術(shù)創(chuàng)新背后,人形機(jī)器人產(chǎn)業(yè)競(jìng)爭(zhēng)也在加劇。
2025年不僅是人形機(jī)器人步入量產(chǎn)的關(guān)鍵一年,也將會(huì)是人形機(jī)器人大浪淘沙的一年。
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。
關(guān)注智造、硬件、機(jī)器人。