作者| 金旺
欄目| 機(jī)器人新紀(jì)元
2024年世界機(jī)器人大會(huì)上,優(yōu)必選首次展示了“人形機(jī)器人工業(yè)場(chǎng)景解決方案”。這是優(yōu)必選研發(fā)人形機(jī)器人第12個(gè)年頭。
這一年,人形機(jī)器人火爆全球,作為人形機(jī)器人第一股,優(yōu)必選也動(dòng)作頗多。
2024年4月27日,優(yōu)必選作為三大持股企業(yè)之一的北京具身智能機(jī)器人創(chuàng)新中心,發(fā)布了全球首個(gè)純電驅(qū)擬人奔跑的全尺寸人形機(jī)器人“天工”,能以6公里/小時(shí)的速度穩(wěn)定奔跑。
緊接著,優(yōu)必選在北京經(jīng)開(kāi)區(qū)成立了人形機(jī)器人總部。
這一年,人形機(jī)器人進(jìn)工廠成為主流趨勢(shì),優(yōu)必選與東風(fēng)柳汽、吉利汽車、一汽紅旗、一汽-大眾青島分公司、奧迪一汽等多家車廠達(dá)成合作。面向工業(yè)場(chǎng)景的Walker S系列人形機(jī)器人開(kāi)始進(jìn)入到汽車工廠實(shí)訓(xùn),執(zhí)行分揀、搬運(yùn)、質(zhì)檢等任務(wù)。
據(jù)優(yōu)必選科技副總裁、研究院執(zhí)行院長(zhǎng)焦繼超透露,“優(yōu)必選人形機(jī)器人現(xiàn)在已經(jīng)在多個(gè)汽車工廠進(jìn)入到了實(shí)訓(xùn)驗(yàn)證階段,其中,Walker S Lite已經(jīng)在極氪5G智慧工廠連續(xù)21天協(xié)同員工執(zhí)行搬運(yùn)任務(wù)。”
2024年,在全球供應(yīng)鏈面臨再整合趨勢(shì)下,人形機(jī)器人進(jìn)工廠實(shí)訓(xùn)成了中國(guó)高端制造業(yè)的長(zhǎng)期主義。
01 人形機(jī)器人“三步走”進(jìn)工廠
過(guò)去一年是優(yōu)必選最忙碌的一年,也是優(yōu)必選工業(yè)人形機(jī)器人最為忙碌的一年。
2023年11月2日,工信部印發(fā)《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見(jiàn)》,意見(jiàn)中指出:
“要聚焦3C、汽車等制造業(yè)重點(diǎn)領(lǐng)域,提升人形機(jī)器人工具操作與任務(wù)執(zhí)行能力,打造人形機(jī)器人示范產(chǎn)線和工廠,在典型制造場(chǎng)景實(shí)現(xiàn)深度應(yīng)用。
面向結(jié)構(gòu)化制造業(yè)環(huán)節(jié),推動(dòng)人形機(jī)器人在裝配、轉(zhuǎn)運(yùn)、檢測(cè)、維護(hù)等工序的應(yīng)用和推廣,面向非結(jié)構(gòu)化生產(chǎn)制造環(huán)節(jié),加強(qiáng)人形機(jī)器人與設(shè)備、人員、環(huán)境寫(xiě)作交互能力,支持柔性化、定制化生產(chǎn)制造。”
這樣的指導(dǎo)意見(jiàn),為人形機(jī)器人產(chǎn)業(yè)落地指明了方向。
實(shí)際上,在此之前,在人形機(jī)器人領(lǐng)域已經(jīng)深耕十多年的優(yōu)必選,面對(duì)這波全球人形機(jī)器人熱潮,已經(jīng)悄悄展開(kāi)產(chǎn)業(yè)調(diào)研,在200多天調(diào)研了20多家新能源汽車、3C電子等智能制造企業(yè)后,他們看到了人形機(jī)器人在汽車工廠落地的確定性機(jī)會(huì)。
據(jù)焦繼超介紹,汽車制造業(yè)是自動(dòng)化程度最高的產(chǎn)業(yè),但即便是這樣一個(gè)產(chǎn)業(yè),仍然需要大量的人力。
汽車工廠分為四大工藝流程,分別是沖壓、焊裝、涂裝、總裝,在前三個(gè)流程中,工業(yè)機(jī)械臂、AGV等工業(yè)機(jī)器人已經(jīng)能夠從事大量重復(fù)性工作,但在汽車總裝線上,依然存在一些諸如物料分揀、線速組裝、氣體檢測(cè)等工作,或是高溫環(huán)境、或存在有害氣體,對(duì)人類存在一定的危害性。
一方面,汽車總裝工廠中存在亟需機(jī)器人的工作崗位,另一方面,汽車產(chǎn)業(yè)每年都面臨著大量用工缺口。
據(jù)人社部、工信部、教育部聯(lián)合發(fā)布的《制造業(yè)人工發(fā)展規(guī)劃指南》中給出的預(yù)測(cè)數(shù)據(jù)顯示,到2025年,中國(guó)制造業(yè)工業(yè)缺口將接近3000萬(wàn)人,其中新能源汽車產(chǎn)業(yè)人才缺口將達(dá)到103萬(wàn)人。
實(shí)際上,隨著國(guó)內(nèi)新能源汽車產(chǎn)業(yè)逐漸成熟、產(chǎn)能持續(xù)攀升,不少新能源汽車企已經(jīng)開(kāi)始面臨缺工少工問(wèn)題,由于工作環(huán)境惡劣,不少汽車工廠工人流失率高,長(zhǎng)期處于不滿工狀態(tài)。
這些原本由工人操作的非結(jié)構(gòu)化環(huán)境中的工作,又很難通過(guò)傳統(tǒng)工業(yè)機(jī)器人來(lái)滿足需求。
于是,汽車產(chǎn)業(yè)也成了最有動(dòng)力接觸人形機(jī)器人的產(chǎn)業(yè)。
據(jù)焦繼超透露,早在2023年,就陸續(xù)有車企帶著真實(shí)需求找到優(yōu)必選,希望優(yōu)必選能為他們提供人形機(jī)器人解決方案。
實(shí)際上,優(yōu)必選工業(yè)版人形機(jī)器人Walker S也是在2023年開(kāi)始陸續(xù)進(jìn)入汽車產(chǎn)業(yè),與車企進(jìn)行聯(lián)合實(shí)訓(xùn)驗(yàn)證。
通過(guò)在真實(shí)的工廠環(huán)境中進(jìn)行實(shí)訓(xùn),人形機(jī)器人可以在實(shí)際任務(wù)環(huán)節(jié)收集數(shù)據(jù),了解企業(yè)的生產(chǎn)需求,完成自我迭代升級(jí),為正式的工業(yè)應(yīng)用做準(zhǔn)備。
同時(shí),實(shí)訓(xùn)允許人形機(jī)器人面對(duì)實(shí)際生產(chǎn)中可能遇到的各種非標(biāo)準(zhǔn)情況,從而提高其適應(yīng)性和泛化能力。在實(shí)訓(xùn)過(guò)程中遇到的挑戰(zhàn),可以激發(fā)高動(dòng)態(tài)運(yùn)動(dòng)控制技術(shù)、緊湊化一體化關(guān)節(jié)設(shè)計(jì)、智能化與自主化的場(chǎng)景感知與任務(wù)規(guī)劃等關(guān)鍵技術(shù)的突破。
例如針對(duì)工廠的分揀、零件安裝等任務(wù),優(yōu)必選迭代了多模態(tài)大模型的模型架構(gòu),實(shí)現(xiàn)更強(qiáng)的多模態(tài)感知與認(rèn)知能力,讓人形機(jī)器人可以識(shí)別場(chǎng)景與地圖并選擇導(dǎo)航的最優(yōu)路徑。
此外,通過(guò)深入整合運(yùn)動(dòng)控制技術(shù),人形機(jī)器人可以更加準(zhǔn)確的執(zhí)行抓取動(dòng)作。
隨著汽車產(chǎn)業(yè)智能化、電動(dòng)化轉(zhuǎn)型的加速,消費(fèi)端對(duì)于汽車產(chǎn)品的個(gè)性化、定制化需求越來(lái)越高,行業(yè)競(jìng)爭(zhēng)的不斷加劇,迫使整車功能越來(lái)越復(fù)雜,產(chǎn)品更新?lián)Q代越來(lái)越快,生命周期越來(lái)越短,而產(chǎn)品開(kāi)發(fā)及生命周期的縮短,也要求更加快速敏捷的交付。
在汽車制造過(guò)程中應(yīng)用人形機(jī)器人,不僅可以替代人機(jī)工程差的作業(yè),將工人從危險(xiǎn)、重復(fù)、價(jià)值低的工作中解放出來(lái),也能降低因?yàn)槿斯ぱb配對(duì)產(chǎn)品設(shè)計(jì)的限制,提高設(shè)計(jì)自由度,滿足市場(chǎng)端更加定制化、個(gè)性化的需求。
在真實(shí)造車環(huán)境中部署應(yīng)用人形機(jī)器人,能夠不斷積累全要素生產(chǎn)數(shù)據(jù),利用AI技術(shù)感知、學(xué)習(xí)、迭代,實(shí)現(xiàn)智能化管理閉環(huán),基于人形機(jī)器人具身智能的自主學(xué)習(xí)能力,可以快速適應(yīng)新任務(wù)要求,在制造場(chǎng)景中提供敏捷部署,助力實(shí)現(xiàn)整車產(chǎn)品的高質(zhì)量、敏捷交付。
不過(guò),優(yōu)必選科技首席品牌官譚旻解釋稱,“目前的人形機(jī)器人發(fā)展依然處于早期階段,尤其是在面對(duì)工業(yè)場(chǎng)景落地時(shí),工廠中的實(shí)訓(xùn)驗(yàn)證往往需要12-24個(gè)月。”
為此,將工業(yè)作為人形機(jī)器人三大應(yīng)用場(chǎng)景之一的優(yōu)必選,針對(duì)人形機(jī)器人在工業(yè)場(chǎng)景中的應(yīng)用制定了三個(gè)階段發(fā)展戰(zhàn)略:
第一階段(2023年-2024年),以新能源汽車制造場(chǎng)景作為人形機(jī)器人在工業(yè)場(chǎng)景的切入點(diǎn),實(shí)現(xiàn)人形機(jī)器人在搬運(yùn)、物料分揀等工業(yè)場(chǎng)景中的測(cè)試,不斷完善硬件的穩(wěn)定性和可靠性;
第二階段(2025年-2027年),優(yōu)必選人形機(jī)器人將逐步拓展至中等難度任務(wù),重點(diǎn)打造3-5個(gè)專用場(chǎng)景下的應(yīng)用,隨著大規(guī)模的落地應(yīng)用,不斷提升產(chǎn)品的性能,逐漸實(shí)現(xiàn)規(guī)模商業(yè)化,不斷降低人形機(jī)器人的成本,并橫向拓展至消費(fèi)電子制造業(yè)等其它行業(yè)及應(yīng)用場(chǎng)景;
第三階段(2028年-2033年),優(yōu)必選人形機(jī)器人將進(jìn)一步拓展到較為復(fù)雜的任務(wù)場(chǎng)景,具備超過(guò)10+種技能,成為多任務(wù)通用型工業(yè)人形機(jī)器人。
在這個(gè)發(fā)展過(guò)程中,人工智能技術(shù)的發(fā)展和突破,同樣對(duì)優(yōu)必選人形機(jī)器人升級(jí)迭代起著關(guān)鍵作用。
02 10倍速培養(yǎng)工業(yè)人形機(jī)器人
在ChatGPT面世之前,優(yōu)必選曾有過(guò)這樣一個(gè)判斷:
人工智能技術(shù)的突破,對(duì)于人形機(jī)器人發(fā)展將會(huì)帶來(lái)10倍速的提速。
譚旻解釋稱,“原本在我們規(guī)劃中10年才能完成的事情,因?yàn)槿斯ぶ悄芗夹g(shù)的突破,可能一年就完成了。”
當(dāng)以ChatGPT為代表的新一代人工智能技術(shù)爆發(fā)后,具身智能熱潮隨之而來(lái),優(yōu)必選在2023年也快速對(duì)具身智能技術(shù)體系框架進(jìn)行了論證,并將具身智能拆分為大腦、小腦、肢體幾個(gè)維度。
焦繼超告訴我們,在這套技術(shù)框架中:
“大腦主要完成完成動(dòng)態(tài)感知和任務(wù)規(guī)劃,小腦主要完成包括步態(tài)、靈巧操作在內(nèi)的運(yùn)動(dòng)控制,更重要的是,優(yōu)必選早在2021年就打造了用于訓(xùn)練人形機(jī)器人的仿真系統(tǒng),很早就實(shí)現(xiàn)了Real2Sim和Sim2Real的閉環(huán)。”
就大腦而言,工業(yè)場(chǎng)景中很少用到語(yǔ)音交互,大部分工業(yè)中的交互已經(jīng)被寫(xiě)入了流程自動(dòng)化中,人形機(jī)器人進(jìn)入工廠時(shí),反而對(duì)機(jī)器人的決策能力有較高的需求。
現(xiàn)在的工業(yè)場(chǎng)景如果某個(gè)流程中間有一個(gè)環(huán)節(jié)缺失或中斷,基于傳統(tǒng)自動(dòng)化的工廠解決方案中,后續(xù)流程就無(wú)法再向下進(jìn)行。
基于多模態(tài)大模型的人形機(jī)器人,由于具備了一些基礎(chǔ)常識(shí),在某個(gè)環(huán)節(jié)缺失或中斷后,人形機(jī)器人可以自主決策進(jìn)入到上一個(gè)流程。
因而,在工業(yè)場(chǎng)景中,更需要的往往不是語(yǔ)言大模型,而是操作大模型。
正是基于這樣的思考,焦繼超告訴我們,“優(yōu)必選基于以往積累的大量數(shù)據(jù),通過(guò)組合微調(diào)形成的小模型,已經(jīng)能夠在邊緣側(cè)為人形機(jī)器人提供一定的決策能力。”
針對(duì)不同工業(yè)場(chǎng)景任務(wù)需求,優(yōu)必選又融合了強(qiáng)化學(xué)習(xí)、模仿學(xué)習(xí),開(kāi)發(fā)訓(xùn)練了具身小腦,通過(guò)學(xué)習(xí)型運(yùn)動(dòng)控制技術(shù)提高人形機(jī)器人控制的魯棒性。
此外,優(yōu)必選還自研了3D語(yǔ)義地圖,用以提升機(jī)器人的自主導(dǎo)航和場(chǎng)景理解能力。
據(jù)焦繼超透露,人形機(jī)器人在工業(yè)場(chǎng)景目前的典型操作任務(wù)分為六類:智能搬運(yùn)、智能質(zhì)檢、過(guò)程材料操作、螺絲擰緊、零件安裝、SPS分揀。
在WRC 2024現(xiàn)場(chǎng),優(yōu)必選也首次展出了他們的人形機(jī)器人工業(yè)場(chǎng)景解決方案——通過(guò)現(xiàn)場(chǎng)布設(shè)了一條工廠流水線模擬環(huán)境,演示了優(yōu)必選Walker S系列工業(yè)人形機(jī)器人在智能搬運(yùn)、智能分揀、智能質(zhì)檢等任務(wù)實(shí)操能力。
據(jù)現(xiàn)場(chǎng)工作人員介紹,Walker S在執(zhí)行搬運(yùn)任務(wù)時(shí),會(huì)先構(gòu)建周圍環(huán)境的3D語(yǔ)義地圖,以復(fù)雜環(huán)境中的精準(zhǔn)導(dǎo)航與避障,通過(guò)視覺(jué)識(shí)別和模仿學(xué)習(xí),機(jī)器人能識(shí)別并處理多種箱子,并通過(guò)變導(dǎo)納控制技術(shù)確保夾抱力穩(wěn)定精細(xì)。
在搬運(yùn)過(guò)程中,Walker S能夠?qū)⒘悴考鋸膫}(cāng)庫(kù)地板搬運(yùn)至傳送帶,并實(shí)時(shí)記錄數(shù)據(jù),與智慧工廠倉(cāng)庫(kù)系統(tǒng)無(wú)縫對(duì)接,提升任務(wù)執(zhí)行透明度與效率。
03 優(yōu)必選沒(méi)有價(jià)格焦慮
隨著人形機(jī)器人、具身智能概念火爆全球,國(guó)內(nèi)涌現(xiàn)出了諸多人形機(jī)器人團(tuán)隊(duì),僅僅是在WRC 2024上,就有27款人形機(jī)器人亮相。
也正是在越來(lái)越多人形機(jī)器人團(tuán)隊(duì)涌入這一賽道時(shí),人形機(jī)器人開(kāi)始卷向價(jià)格。
當(dāng)被問(wèn)及如何看待當(dāng)下人形機(jī)器人價(jià)格內(nèi)卷時(shí),譚旻告訴我們:
“從全球人形機(jī)器人行業(yè)來(lái)看,在發(fā)展的初期階段,成本一定不是科技公司的核心競(jìng)爭(zhēng)力,人形機(jī)器人作為繼計(jì)算機(jī)、智能手機(jī)、新能源汽車后,又一個(gè)萬(wàn)億級(jí)規(guī)模產(chǎn)業(yè),在還沒(méi)有實(shí)現(xiàn)全球規(guī)模性商業(yè)化之前,要比拼的一定不是價(jià)格。
真正能在工業(yè)場(chǎng)景中應(yīng)用、能在工業(yè)場(chǎng)景中產(chǎn)生價(jià)值才是機(jī)器人公司的核心競(jìng)爭(zhēng)力,這也是這么多車企會(huì)選擇與優(yōu)必選合作的原因。”
焦繼超說(shuō),“車廠有自己對(duì)硬件行業(yè)客觀規(guī)律的清醒認(rèn)識(shí),所以我們?nèi)チ暮献鞯臅r(shí)候,他們不會(huì)要求一定要很低的價(jià)格才能買,因?yàn)榧饶軡M足他的要求又價(jià)格很低,是無(wú)法實(shí)現(xiàn)的。”
據(jù)優(yōu)必選官方透露,優(yōu)必選已經(jīng)在與包括東風(fēng)柳汽、吉利汽車、一汽紅旗、一汽-大眾青島分公司、奧迪一汽等多家車企合作,優(yōu)必選的工業(yè)版人形機(jī)器人也正在陸續(xù)進(jìn)入車企工廠,開(kāi)始驗(yàn)證物料分揀、貨物搬運(yùn)、質(zhì)量檢測(cè)任務(wù)的執(zhí)行能力。
譚旻認(rèn)為,這些車企之所以會(huì)選擇和優(yōu)必選合作,是因?yàn)閮?yōu)必選深耕人形機(jī)器人12年,不僅是全球人形機(jī)器人專利擁有數(shù)量最多的企業(yè),而且優(yōu)必選的人形機(jī)器人已經(jīng)在多個(gè)場(chǎng)景中應(yīng)用落地并持續(xù)提供服務(wù)。
“車企很重視機(jī)器人的穩(wěn)定性和可靠性。我們的人形機(jī)器人曾經(jīng)在迪拜世博會(huì)中國(guó)館連續(xù)穩(wěn)定工作過(guò)6個(gè)月,在中國(guó)科技館也已經(jīng)連續(xù)穩(wěn)定服務(wù)了有兩年之久,在這個(gè)過(guò)程中,優(yōu)必選人形機(jī)器人完成了從實(shí)驗(yàn)室到商業(yè)化場(chǎng)景0到0.1階段,這在全球也是屈指可數(shù)的。
下一站是工業(yè)場(chǎng)景的商業(yè)化,要完成從0.1到1的部分。目前優(yōu)必選工業(yè)版人形機(jī)器人已經(jīng)獲得車企超過(guò)500臺(tái)的意向訂單。”
實(shí)際上,當(dāng)下全球供應(yīng)鏈正在經(jīng)歷著又一次整合和重塑,在這次全球供應(yīng)鏈整合中,中國(guó)如何發(fā)展好高端制造業(yè)、在全球供應(yīng)鏈中繼續(xù)發(fā)揮重要作用就成了。
焦繼超說(shuō),“現(xiàn)在人形機(jī)器人還處于早期發(fā)展階段,真正令我們感到焦慮的是,技術(shù)需要快速迭代,以滿足工業(yè)場(chǎng)景的真實(shí)需求。”
不過(guò),在和諸多車企展開(kāi)深入合作后,焦繼超發(fā)現(xiàn),優(yōu)必選和很多車企有了一個(gè)共識(shí)——人形機(jī)器人雖然不是現(xiàn)在工業(yè)場(chǎng)景唯一的選擇,但最終的形態(tài)將會(huì)是人形機(jī)器人。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。
關(guān)注智造、硬件、機(jī)器人。