在宇樹人形機(jī)器人登上春晚跳起東北二人轉(zhuǎn)時(shí),仿佛就注定了人形機(jī)器人在2025年仍將繼續(xù)橫掃全球市場(chǎng)。
這不,剛過完春節(jié),美國(guó)人形機(jī)器人明星企業(yè)Figure AI就官宣要和OpenAI“鬧分手”,緊接著是波士頓動(dòng)力與前CEO成立的研究院再“牽手”。
當(dāng)然,馬斯克也沒閑著,他則是在加緊為特斯拉招兵買馬,為人形機(jī)器人量產(chǎn)做準(zhǔn)備。
“機(jī)器人公司應(yīng)該自己做模型”
作為美國(guó)最具名氣的人形機(jī)器人公司之一,成立于2022年的Figure AI如今已經(jīng)是估值26億美元(189億元)的準(zhǔn)獨(dú)角獸企業(yè)。
據(jù)公開信息顯示,在2024年年初的融資中,OpenAI與微軟、英偉達(dá)等科技巨頭和投資機(jī)構(gòu)一同為Figure AI提供了B輪6.75億美元的融資。
Figure AI在美國(guó)追捧程度由此也可見一斑。
作為Figure AI研發(fā)的人形機(jī)器人產(chǎn)品,F(xiàn)igure 01曾在2024年3月搭載OpenAI大模型對(duì)外進(jìn)行demo演示,彼時(shí)這一可以通過語音控制收拾杯盤、整理桌面的人形機(jī)器人demo視頻一經(jīng)放出,在全球范圍內(nèi)引起廣泛關(guān)注。
隨后,F(xiàn)igure AI不僅官宣了與寶馬汽車工廠的試點(diǎn)合作,還宣布了第二代人形機(jī)器人Figure 02將使用 OpenAI 模型進(jìn)行自然語言交流。
不過,F(xiàn)igure AI團(tuán)隊(duì)最近有了新的想法。
Figure AI創(chuàng)始人Brett Adcock在接受外媒采訪時(shí)稱,“我們發(fā)現(xiàn),要想在現(xiàn)實(shí)世界中解決人形機(jī)器人的具身智能問題,就必須自己做人工智能技術(shù)研發(fā),我們不能外包人工智能就像我們無法外包硬件一樣。”
為此,Brett Adcock也宣布了與OpenAI的“分手”,宣布放棄使用OpenAI的大模型。
與此同時(shí),Adcock在其社交媒體平臺(tái)上還表示,F(xiàn)igure AI在端到端機(jī)器人AI上已經(jīng)有了重大突破,將會(huì)在接下來30天里展示一些人們?cè)谌诵螜C(jī)器人上未曾實(shí)現(xiàn)的能力。
這算是Brett Adcock為我們埋下了一個(gè)彩蛋,不過,努力在將人工智能技術(shù)融入人形機(jī)器人的不僅有Figure AI,幾乎所有人形機(jī)器人團(tuán)隊(duì)都在將人工智能作為一個(gè)重要的技術(shù)研發(fā)方向。
這其中自然也包括美國(guó)老牌機(jī)器人明星團(tuán)隊(duì)波士頓動(dòng)力。
波士頓動(dòng)力為機(jī)器人注入AI
波士頓動(dòng)力是美國(guó)老牌機(jī)器人團(tuán)隊(duì),早在1992年由麻省理工學(xué)院脫胎,創(chuàng)始團(tuán)隊(duì)也是由Marc Raibert拉起的一支麻省理工科班團(tuán)隊(duì)。
波士頓動(dòng)力早年間因各種機(jī)器人demo視頻在YouTube上走紅,因而也一直被視為機(jī)器人界的網(wǎng)紅,不過,由于波士頓動(dòng)力的機(jī)器人產(chǎn)品遲遲難以量產(chǎn)商用,在團(tuán)隊(duì)成立后的幾年里被幾經(jīng)轉(zhuǎn)手,先后被谷歌、軟銀、現(xiàn)代汽車收購(gòu)。
在2021年6月正式被現(xiàn)代汽車收購(gòu)時(shí),波士頓動(dòng)力創(chuàng)始人兼CEO Marc Raibert已經(jīng)卸任離職,并在2022年8月創(chuàng)立了波士頓動(dòng)力人工智能研究所,這一研究院后更名為機(jī)器人與人工智能研究所(RAI Institute),這一研究所的目標(biāo)正是為波士頓動(dòng)力機(jī)器人做基礎(chǔ)技術(shù)研究,人工智能自然也是其中的重中之重。
就在被現(xiàn)代汽車收購(gòu)后不久,全球迎來了人形機(jī)器人浪潮,在這波浪潮中,波士頓動(dòng)力于2024年官宣轉(zhuǎn)向電驅(qū),并發(fā)布了電驅(qū)版的Atlas。
近日,波士頓動(dòng)力官宣了一項(xiàng)與其前CEO Marc Raibert創(chuàng)辦的RAI研究所的合作,這項(xiàng)合作旨在為電驅(qū)版Atlas人形機(jī)器人建立強(qiáng)化學(xué)習(xí)訓(xùn)練的共享機(jī)制,提升電驅(qū)版Atlas在動(dòng)態(tài)環(huán)境中的移動(dòng)操控能力。
Marc Raibert在官方聲明中指出,“RAI的目標(biāo)是開發(fā)支持未來智能機(jī)器的技術(shù),與波士頓動(dòng)力合作開發(fā)Atlas使我們能夠在最先進(jìn)的人形機(jī)器人上取得強(qiáng)化學(xué)習(xí)方面的進(jìn)展,這項(xiàng)工作將在提升人形機(jī)器人的能力方面發(fā)揮關(guān)鍵作用,不僅可以擴(kuò)展其技能,還可以簡(jiǎn)化獲得新技能的過程。”
更關(guān)注機(jī)器人技術(shù)研究的Marc Raibert,正在通過人工智能技術(shù)支持波士頓動(dòng)力機(jī)器人走向商業(yè)市場(chǎng),不過,要說人形機(jī)器人的商業(yè)化,還要看更為激進(jìn)的馬斯克。
特斯拉Optimus年內(nèi)要量產(chǎn)萬臺(tái)
馬斯克最近也沒閑著。
在1月30日的特斯拉2024年Q4業(yè)績(jī)會(huì)上,馬斯克透露,特斯拉人形機(jī)器人Optimus生產(chǎn)線月產(chǎn)能已經(jīng)達(dá)到1000臺(tái),明年將建設(shè)的第二條生產(chǎn)線月產(chǎn)能將會(huì)達(dá)到10000臺(tái)。
他還指出,預(yù)計(jì)今年Optimus將在特斯拉內(nèi)部投入使用,負(fù)責(zé)完成工廠中最無聊、最討厭的一系列工作,明年下半年將會(huì)面向其他公司交付產(chǎn)品。
為了加緊人形機(jī)器人產(chǎn)品量產(chǎn)并在特斯拉工廠中得以應(yīng)用,特斯拉也在緊急招聘相關(guān)工程師,據(jù)官方掛在招聘網(wǎng)站上的信息顯示,特斯拉目前正在為機(jī)器人團(tuán)隊(duì)招聘工程師、流程主管、產(chǎn)品經(jīng)理等十多個(gè)崗位。
馬斯克是這波人形機(jī)器人浪潮的關(guān)鍵人物,始終對(duì)人形機(jī)器人未來前景保持著樂觀的態(tài)度,在Q4的業(yè)績(jī)會(huì)上,他還公開了特斯拉2025年10000臺(tái)機(jī)器人量產(chǎn)目標(biāo),并指出,未來隨著Optimus年產(chǎn)量趨穩(wěn)(年產(chǎn)量達(dá)到100萬臺(tái)以上),Optimus生產(chǎn)成本將會(huì)低于2萬美元。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。
關(guān)注智造、硬件、機(jī)器人。