作者| 金旺
欄目| 具身資訊
近日,在民營(yíng)企業(yè)座談會(huì)上,宇樹(shù)科技創(chuàng)始人王興興指出,“今年年底之前,整個(gè)AI的人形機(jī)器人會(huì)達(dá)到一個(gè)新的量級(jí)。”
作為國(guó)內(nèi)人形機(jī)器人明星企業(yè),在2024年9月完成C輪融資后,宇樹(shù)科技估值已經(jīng)突破80億元。
不過(guò),宇樹(shù)科技的人形機(jī)器人真正在大眾層面得到廣泛認(rèn)知,是在今年春晚上。
在今年春晚上,宇樹(shù)科技16臺(tái)人形機(jī)器人H1與新疆藝術(shù)學(xué)院舞蹈演員表演的舞蹈節(jié)目《秧BOT》,作為今年春晚的特色之一,迅速讓人形機(jī)器人闖入大眾視野。
與此同時(shí),人形機(jī)器人在人工智能技術(shù)加持下,確實(shí)在以肉眼可見(jiàn)的速度發(fā)生著改變。
01 機(jī)器人跳舞太“絲滑”,被質(zhì)疑為AI生成
近日,一個(gè)宇樹(shù)人形機(jī)器人G1的跳舞視頻在網(wǎng)上爆火,在視頻中,從機(jī)器人跳舞的穩(wěn)定性、流暢度,以及自然程度上來(lái)看,都很難想象是現(xiàn)階段人形機(jī)器人能夠?qū)崿F(xiàn)的能力。
畢竟,宇樹(shù)人形機(jī)器人在春晚舞臺(tái)上還曾因被舞蹈演員“扶著”下臺(tái)被主持人調(diào)侃。
這段人形機(jī)器人跳舞視頻發(fā)布后,在視頻平臺(tái)上被算法識(shí)別并自動(dòng)打上了“疑似使用AI技術(shù)生成”的提醒標(biāo)簽。
為了證明人形機(jī)器人跳舞的真實(shí)性,宇樹(shù)科技官方昨日在視頻平臺(tái)上又更新了一個(gè)視頻,視頻中,宇樹(shù)G1跳的依然是之前的舞蹈,不同的是,鏡頭側(cè)面放置了一面全身鏡實(shí)時(shí)顯示周邊環(huán)境,并時(shí)不時(shí)由旁邊的員工給他丟個(gè)球、來(lái)兩下,進(jìn)行干擾。
在這則視頻中,宇樹(shù)科技官方也對(duì)上一個(gè)視頻中提到的“算法升級(jí),任意舞蹈任意學(xué)”的說(shuō)法給出了解釋?zhuān)?/p>
“最近幾天剛開(kāi)發(fā)好的功能,還沒(méi)有推送給客戶(hù),不同型號(hào)版本的機(jī)器人功能也有差異。”
這一方面證實(shí)了機(jī)器人跳舞的真實(shí)性,另一方面也對(duì)客戶(hù)手中的機(jī)器人沒(méi)有這個(gè)功能給出了一個(gè)交代。
據(jù)悉,宇樹(shù)科技的人形機(jī)器人在今年登上春晚后不久,就曾直接在京東平臺(tái)上開(kāi)售H1和G1兩個(gè)型號(hào)的人形機(jī)器人,前者售價(jià)65萬(wàn)元,預(yù)計(jì)60天交貨,后者售價(jià)9.9萬(wàn)元起售,預(yù)計(jì)45天交貨。
然而,這兩款產(chǎn)品在上線(xiàn)不久后就進(jìn)行了下架,如今依然需要通過(guò)官方渠道進(jìn)行購(gòu)買(mǎi)。
值得注意的是,宇樹(shù)科技這款人形機(jī)器人此前在京東線(xiàn)上頁(yè)面顯示整機(jī)重約35kg,身高127cm,續(xù)航為2—4小時(shí),主要面向場(chǎng)景為娛樂(lè)陪伴。
對(duì)于希望在2025年實(shí)現(xiàn)量產(chǎn)的人形機(jī)器人產(chǎn)業(yè)而言,面向消費(fèi)市場(chǎng)的娛樂(lè)陪伴場(chǎng)景,顯然是一個(gè)更廣闊的量產(chǎn)市場(chǎng)。
不過(guò),王興興在近日接受媒體采訪時(shí)指出:
“今年年底之前,整個(gè)AI(驅(qū)動(dòng))的人形機(jī)器人會(huì)達(dá)到一個(gè)新的量級(jí),如果順利的話(huà),諸如服務(wù)業(yè)、工業(yè)等基礎(chǔ)場(chǎng)景到明后年就可以推起來(lái)了,但家用(場(chǎng)景)會(huì)慢一點(diǎn),因?yàn)榧矣脤?duì)安全性的要求更高,需要技術(shù)相對(duì)更成熟一點(diǎn)。”
02 人形機(jī)器人產(chǎn)業(yè)繼續(xù)競(jìng)速
在宇樹(shù)人形機(jī)器人登上春晚,馬斯克號(hào)稱(chēng)Optimus將要量產(chǎn)的2025年,人形機(jī)器人仍在競(jìng)速。
就在近日,我們看到,美國(guó)人形機(jī)器人明星企業(yè)Apptronik官宣融資3.5億美元(約25.5億元),國(guó)內(nèi)也有初創(chuàng)公司靈寶CASBOT完成了億元天使輪融資。
在技術(shù)迭代方面,逐際動(dòng)力近日發(fā)布了LimX VGM具身機(jī)器人操作算法,據(jù)官方公開(kāi)資料顯示,這是一個(gè)基于視頻生成大模型的具身操作算法,通過(guò)人類(lèi)操作視頻數(shù)據(jù)對(duì)現(xiàn)有的視頻生成大模型進(jìn)行后訓(xùn)練,僅需將場(chǎng)景圖片和操作任務(wù)指令作為提示Prompts,即可實(shí)現(xiàn)任務(wù)理解與拆分、物體操作軌跡生成以及機(jī)器人操作執(zhí)行的全流程,全過(guò)程零真機(jī)樣本數(shù)據(jù),并且可實(shí)現(xiàn)多平臺(tái)泛化。
加速進(jìn)化Booster T1也在近日公開(kāi)了耐用性和撞擊測(cè)試視頻,在官方公開(kāi)的視頻中,Booster T1人形機(jī)器人在表演完“胸口碎大石”后,依然可以再次起身。
不過(guò),在這一系列人形機(jī)器人企業(yè)融資、技術(shù)創(chuàng)新背后,人形機(jī)器人產(chǎn)業(yè)競(jìng)爭(zhēng)也在加劇。
2025年不僅是人形機(jī)器人步入量產(chǎn)的關(guān)鍵一年,也將會(huì)是人形機(jī)器人大浪淘沙的一年。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線(xiàn)性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話(huà)問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。
關(guān)注智造、硬件、機(jī)器人。