作者|金旺
從早稻田大學(xué)1972年研發(fā)的WABOT,到特斯拉2022年首秀的Optimus,人類科學(xué)家對(duì)人形機(jī)器人的研發(fā)走過了半個(gè)世紀(jì)。在這半個(gè)世紀(jì)里,人形機(jī)器人的發(fā)展已經(jīng)從本田ASIMO、波士頓動(dòng)力Atlas代表的技術(shù)驗(yàn)證期,過渡到了以特斯拉Optimus為代表的商業(yè)試水期,一個(gè)新的機(jī)器人時(shí)代正在開啟。
為此,至頂科技特別策劃推出《機(jī)器人新紀(jì)元》專題報(bào)道,旨在探尋全球機(jī)器人團(tuán)隊(duì)的技術(shù)變遷和創(chuàng)新故事。
本篇為《機(jī)器人新紀(jì)元》專題報(bào)道第一篇深度文章。
2016年,傅利葉智能內(nèi)部核心研發(fā)團(tuán)隊(duì)曾討論過一個(gè)事關(guān)公司產(chǎn)品路線的問題,也就是“是否要研發(fā)人形機(jī)器人”。
當(dāng)時(shí)的傅利葉智能團(tuán)隊(duì)剛剛成立一年,已經(jīng)開始在康復(fù)機(jī)器人領(lǐng)域發(fā)力,但做人形機(jī)器人是自2002年就開始在上海交通大學(xué)機(jī)器人隊(duì)研究機(jī)器人的顧捷,一直以來的夢想。
作為被視為機(jī)器人終極形態(tài)的人形機(jī)器人,對(duì)于機(jī)器人理想主義者而言,是一個(gè)充滿誘惑的機(jī)器人物種,沒有哪個(gè)機(jī)器人團(tuán)隊(duì)不曾想過研發(fā)人形機(jī)器人,顧捷說,他想這件事兒想了快有二十年了。
不過,無論是就整個(gè)機(jī)器人產(chǎn)業(yè)發(fā)展來看,還是從傅利葉智能團(tuán)隊(duì)當(dāng)時(shí)的自身技術(shù)積累來看,人形機(jī)器人在2016年對(duì)于他們來說都還是一個(gè)為時(shí)尚早的項(xiàng)目,即便做出來,也沒有任何商業(yè)化的可能性,理性告訴顧捷,人形機(jī)器人,還要再等等。
于是,傅利葉智能團(tuán)隊(duì)全身心投入到了醫(yī)療康復(fù)機(jī)器人的產(chǎn)品研發(fā)中,在之后幾年里陸續(xù)推出了上肢康復(fù)機(jī)器人、下肢外骨骼機(jī)器人,成為國內(nèi)最早將外骨骼機(jī)器人商業(yè)化應(yīng)用到醫(yī)療康復(fù)領(lǐng)域的機(jī)器人團(tuán)隊(duì)。
再次將人形機(jī)器人提上日程,是在2019年年中,這一年,傅利葉智能的人形機(jī)器人在內(nèi)部正式立項(xiàng),與此同時(shí),全球人形機(jī)器人開始進(jìn)入到一個(gè)新的商業(yè)創(chuàng)新周期。
沒做人形機(jī)器人的那三年
2015年,傅利葉智能在上海正式成立,在此之前,顧捷已經(jīng)在機(jī)器人領(lǐng)域摸爬滾打多年,在上一次創(chuàng)業(yè)過程中,已經(jīng)在醫(yī)療領(lǐng)域成功推出過大型康復(fù)機(jī)器人,這次,顧捷想要做一些小型化的機(jī)器人。
彼時(shí),國外名為Rewalk的以色列機(jī)器人團(tuán)隊(duì),以因脊髓損傷導(dǎo)致的截癱癱瘓患者為目標(biāo)用戶研發(fā)的外骨骼機(jī)器人剛剛在一年前獲得美國FDA批準(zhǔn)上市,成為美國第一款獲得FDA批準(zhǔn)的外骨骼機(jī)器人。
于是,顧捷就想,能不能在中國做一款這樣的機(jī)器人產(chǎn)品,讓國內(nèi)經(jīng)受著同樣功能障礙的人們能夠重新站起來。
另一個(gè)促使顧捷下定決心要做醫(yī)療外骨骼機(jī)器人的原因是,此前在上海、北京等地大型醫(yī)院康復(fù)中心走訪和調(diào)研經(jīng)歷,他看到過同一個(gè)醫(yī)院里上百名無法像普通人一樣行走的患者,在由康復(fù)治療師使用著最傳統(tǒng)的方式每天進(jìn)行著枯燥而又艱難的康復(fù)訓(xùn)練。
“這種對(duì)內(nèi)心帶來的沖擊和震撼,沒有親身在醫(yī)院康復(fù)科待過的人是無法體會(huì)的,”顧捷告訴科技行者。
研發(fā)第一代下肢外骨骼機(jī)器人,傅利葉智能花了三年時(shí)間,在這三年里,研發(fā)團(tuán)隊(duì)集中攻克了對(duì)于外骨骼機(jī)器人而言尤為關(guān)鍵的力反饋技術(shù)。
在肢體殘障患者治療過程中,往往需要康復(fù)治療師通過雙手為患者進(jìn)行運(yùn)動(dòng)訓(xùn)練,例如康復(fù)治療師手動(dòng)幫助患者進(jìn)行腿部彎曲、伸展訓(xùn)練,患者病癥嚴(yán)重情況和治療階段的不同,進(jìn)行腿部訓(xùn)練需要借助的外力也有所不同,熟練的康復(fù)治療師能夠很好地掌握其中的度。
如果是由機(jī)器人來完成的話,就需要根據(jù)患者做相應(yīng)動(dòng)作的力度來判斷再由機(jī)器人附加多大的力度,來完成相應(yīng)的康復(fù)訓(xùn)練動(dòng)作,這其中用到的,正是力反饋技術(shù)。
本身在醫(yī)療康復(fù)機(jī)器人領(lǐng)域有著深厚積累的傅利葉智能,僅用一年時(shí)間,就在2016年年底研發(fā)出了上肢康復(fù)機(jī)器人Fourier M2,這款擁有助力、主動(dòng)、被動(dòng)、抗阻四種訓(xùn)練模式的康復(fù)機(jī)器人上市后即被華山醫(yī)院、瑞金醫(yī)院等國內(nèi)多家醫(yī)院引進(jìn)。
傅利葉智能上肢康復(fù)機(jī)器人Fourier M2
這款后來作為傅利葉「智能康復(fù)港」解決方案中首款拿下中美歐澳四國醫(yī)療器械注冊(cè)認(rèn)證“大滿貫”的的康復(fù)機(jī)器人產(chǎn)品,也成為中國康復(fù)機(jī)器人進(jìn)入全球市場的一款標(biāo)志性產(chǎn)品。
緊隨上肢康復(fù)機(jī)器人,2017年年初,傅利葉對(duì)外發(fā)布了首款下肢外骨骼機(jī)器人Fourier X1,自那時(shí)起,中國市場終于有了自己的醫(yī)用下肢外骨骼機(jī)器人。
相較于商業(yè)上的成功,讓顧捷記憶更深刻的是當(dāng)時(shí)用上Fourier X1的患者終于能站起來了。“我們發(fā)現(xiàn)這些患者穿上我們的外骨骼機(jī)器人后,第一件事兒就是拉上身邊親朋好友拍照,能夠站起來和身邊人拍照,成了他們那時(shí)最開心的事兒。”
殘奧會(huì)冠軍姚芳穿上外骨骼機(jī)器人站起來行走
不過,顧捷同樣意識(shí)到了,由于當(dāng)時(shí)傅利葉智能的下肢外骨骼機(jī)器人還沒能突破自平衡技術(shù),患者在日常使用時(shí)仍需要借助拐杖。
如何在自平衡技術(shù)上進(jìn)一步突破,解決外骨骼機(jī)器人的自平衡能力,就成了傅利葉智能接下來面臨的更大的挑戰(zhàn)。
與人形機(jī)器人的不期而遇
2019年6月,傅利葉智能人形機(jī)器人正式立項(xiàng),不過,當(dāng)時(shí)這一項(xiàng)目即便是在內(nèi)部,仍屬于保密項(xiàng)目,知道的人并不多。
實(shí)際上,當(dāng)時(shí)傅利葉智能并沒有急著去搭人形機(jī)器人的硬件架構(gòu),而是在內(nèi)部先梳理了一遍人形機(jī)器人所需要的底層核心技術(shù):
要將人形機(jī)器人做好,就需要自研更好的執(zhí)行器,需要自研多維力傳感器,包括控制器和控制算法也需要再加強(qiáng)技術(shù)儲(chǔ)備。
這其中,作為機(jī)器人三大核心零部件之一的執(zhí)行器,對(duì)于人形機(jī)器人尤為關(guān)鍵。
傅利葉智能自研執(zhí)行器在內(nèi)部立項(xiàng)是在2018年,當(dāng)時(shí)正值傅利葉智能第二代下肢外骨骼機(jī)器人研發(fā)期間,第一代下肢外骨骼機(jī)器人X1的執(zhí)行器由于是從市場上直接采購的,電機(jī)、驅(qū)動(dòng)板、減速器構(gòu)成的分體式電路占用空間又大,又讓機(jī)器人更加笨重。
而在這一年正式立項(xiàng)的代號(hào)為FSA的傅利葉智能自研執(zhí)行器中,傅利葉智能對(duì)包括執(zhí)行器的整體結(jié)構(gòu)、電機(jī)驅(qū)動(dòng)、減速器、控制軟件進(jìn)行了集中技術(shù)攻關(guān),到傅利葉智能外骨骼機(jī)器人二代產(chǎn)品發(fā)布時(shí),自研一體式執(zhí)行器也就成為了這代產(chǎn)品的關(guān)鍵亮點(diǎn)。
也是從這一代產(chǎn)品開始,傅利葉智能的機(jī)器人有了自己獨(dú)有的一體式執(zhí)行器。
然而,對(duì)于人形機(jī)器人而言,這樣的執(zhí)行器還遠(yuǎn)遠(yuǎn)不夠。
顧捷告訴科技行者,“人形機(jī)器人需要更多種類、更多尺寸型號(hào)的執(zhí)行器,我們后來單獨(dú)為人形機(jī)器人打造了多款一體式執(zhí)行器。”
為人形機(jī)器人打造的一體式執(zhí)行器
多樣性的執(zhí)行器,只是外骨骼與人形機(jī)器人在技術(shù)復(fù)雜度上的差異之一。
實(shí)際上,外骨骼機(jī)器人與人形機(jī)器人的技術(shù)差異不止如此,顧捷認(rèn)為,二者本質(zhì)上有兩方面的不同:
第一,硬件結(jié)構(gòu)的不同。
人形機(jī)器人更類似人,它要模仿人的運(yùn)動(dòng)能力,要有頭部、軀干、四肢,要能實(shí)現(xiàn)各種各樣的動(dòng)作。而外骨骼機(jī)器人是一種穿戴式裝備,所以它需要通過傳感器對(duì)人的關(guān)節(jié)進(jìn)行力矩補(bǔ)償,從而幫助人類進(jìn)行運(yùn)動(dòng)或康復(fù)訓(xùn)練。
第二,運(yùn)動(dòng)控制的不同。
人形機(jī)器人需要一個(gè)復(fù)雜的自主控制系統(tǒng),它需要自主進(jìn)行感知和決策,需要通過傳感器感知周圍環(huán)境進(jìn)行相應(yīng)的運(yùn)動(dòng)響應(yīng)。而外骨骼機(jī)器人更多依賴于人的交互,它需要通過傳感器獲取人的運(yùn)動(dòng)信息,通過算法實(shí)現(xiàn)力矩補(bǔ)償。
不過,外骨骼機(jī)器人與人形機(jī)器人同樣存在一些相似之處。
例如,二者最終都是要實(shí)現(xiàn)自平衡,安全穩(wěn)定地在各種復(fù)雜地形上行走,因而,當(dāng)傅利葉智能在研發(fā)外骨骼機(jī)器人進(jìn)入到關(guān)鍵的自平衡技術(shù)攻關(guān)時(shí),無論是在供應(yīng)鏈能力儲(chǔ)備上,還是在一體式執(zhí)行器、多維傳感器等核心技術(shù)儲(chǔ)備上,都已經(jīng)漸漸摸到了人形機(jī)器人的大門。
“或許大家沒有注意到,下肢外骨骼機(jī)器人本身就是一種雙足人形機(jī)器人,本質(zhì)上,傅利葉之前在做的事,也一直是沿著人形機(jī)器人的雛形不斷在演進(jìn),”身在其中的顧捷,對(duì)此更是深有體會(huì)。
一群機(jī)器人狂熱者在做的事,剛好在最合適的時(shí)間,與被稱為機(jī)器人的終極形態(tài)的通用人形機(jī)器人交匯,這是一個(gè)不可多得的時(shí)代機(jī)遇,也是傅利葉智能團(tuán)隊(duì)的幸運(yùn)。
“你的人形機(jī)器人,每公里配速是多少?”
2023年6月13日,傅利葉智能在官方渠道正式官宣,通用人形機(jī)器人將在7月發(fā)布,隨著這個(gè)消息一并公布的,還是一則宣傳視頻,視頻中,一個(gè)人形機(jī)器人在大步流星地向前走著。
6月13日官宣視頻中,傅利葉智能人形機(jī)器人大步流星行走
而這段運(yùn)動(dòng)能力的測試視頻的左下角,官方蓋上的時(shí)間戳是2022年7月。顧捷稱,“這確實(shí)是一年前的實(shí)驗(yàn)效果,可能明年、后年,很多公司不一定能實(shí)現(xiàn)這樣的運(yùn)動(dòng)能力。”
肉眼可見的靈巧性,被顧捷視為是當(dāng)下傅利葉智能人形機(jī)器人的絕對(duì)優(yōu)勢。
實(shí)際上,據(jù)傅傅利葉智能通用機(jī)器人事業(yè)部總裁周斌透露,“一些AI公司已經(jīng)等不及我們終版人形機(jī)器人發(fā)布,在我們研發(fā)過程中就已經(jīng)陸續(xù)從我們這里買走了人形機(jī)器人驗(yàn)證他們的AI算法。”
和直接面向醫(yī)療市場的下肢外骨骼機(jī)器人不同,就人形機(jī)器人而言,傅利葉智能首先是希望將其運(yùn)動(dòng)能力做到極致,做一個(gè)通用人形機(jī)器人平臺(tái)。
顧捷告訴科技行者,傅利葉智能現(xiàn)在人形機(jī)器人的目標(biāo)用戶是未來有商業(yè)前景和集成能力的AI公司,以及懂商業(yè)場景的科研團(tuán)隊(duì)。
從2016年覺得人形機(jī)器人技術(shù)不夠成熟,到2019年跨入正式跨入人形機(jī)器人領(lǐng)域,顧捷也看到了人形機(jī)器人市場發(fā)生了兩個(gè)重要變化。
首先是通過團(tuán)隊(duì)的技術(shù)突破,顧捷發(fā)現(xiàn)靈巧的人形機(jī)器人已經(jīng)不再遙不可及。
實(shí)際上,在2019年正式立項(xiàng)研發(fā)人形機(jī)器人時(shí),顧捷并沒有打算對(duì)外發(fā)布人形機(jī)器人,更多是希望作為一個(gè)長期的技術(shù)儲(chǔ)備,然而,隨著技術(shù)研發(fā)的不斷深入,顧捷發(fā)現(xiàn)團(tuán)隊(duì)在人形機(jī)器人領(lǐng)域的技術(shù)積累速度已經(jīng)超出了自己的想象。
顧捷向科技行者透露,“這次發(fā)布的人形機(jī)器人在走路、越障等能力上,相較我們的期望值可能只達(dá)到了20-30分,但是我們已經(jīng)有了足夠的技術(shù)儲(chǔ)備,在接下來幾年里讓我們的人形機(jī)器人運(yùn)動(dòng)能力迅速迭代到60分的一個(gè)水平。”
傅利葉智能人形機(jī)器人的越障能力
盡管現(xiàn)在人形機(jī)器人還只有一個(gè)小朋友的運(yùn)動(dòng)能力,但顧捷認(rèn)為,隨著未來人形機(jī)器人基礎(chǔ)技術(shù)不斷完備,行業(yè)里將不會(huì)再把那么多的注意力放在人形機(jī)器人有多少個(gè)關(guān)節(jié)、多少個(gè)自由度,而是會(huì)以人的體能標(biāo)準(zhǔn)來看待人形機(jī)器人的運(yùn)動(dòng)能力。
傅利葉智能人形機(jī)器人上下坡能力
未來人形機(jī)器人公司在上市路演時(shí),投資人可能會(huì)以一種更有趣方式來進(jìn)行提問:
你的人形機(jī)器人每公里配速是多少?
你的人形機(jī)器人跳遠(yuǎn)能跳多少?
你的人形機(jī)器人摸高是多少?
到那時(shí),人形機(jī)器人才稱得上是一個(gè)通用平臺(tái),通用人形機(jī)器人才算是有了硬件平臺(tái)基礎(chǔ)。
另一個(gè)重要變化則是大模型的出現(xiàn),人工智能大模型的飛速發(fā)展,為人形機(jī)器人帶來了更為強(qiáng)大的魔力。
通用人工智能的最后一公里
人工智能大模型出現(xiàn)后,傅利葉智能團(tuán)隊(duì)的工程師發(fā)現(xiàn),他們完全可以將這樣的大模型嫁接到人形機(jī)器人平臺(tái)上。
例如,他們就曾在一個(gè)只有上肢的人形機(jī)器人平臺(tái)上加載ChatGPT后,讓機(jī)器人表現(xiàn)出一個(gè)開心的狀態(tài),甚至讓機(jī)器人跳一段阿拉伯風(fēng)格的舞蹈,在3D軟件上,他們就能看到機(jī)器人在接受到不同命令時(shí)做出的響應(yīng)。
周斌說,“當(dāng)時(shí)我們的工程師看到這樣的人工智能大模型很興奮,我們自己在內(nèi)部都玩嗨了。”
通過ChatGPT讓機(jī)器人跳一段“街舞”
不過,他們也明白,當(dāng)下的通用人工智能大模型的發(fā)展仍處在一個(gè)早期階段,尤其是與人形機(jī)器人的結(jié)合,周斌借用柏拉圖的洞穴理論解釋稱:
之前的AI沒有真正出去看過世界,現(xiàn)在有了人形機(jī)器人這個(gè)完美的身體,AI終于可以走出去看一看。
這也為當(dāng)下熱議的具身智能做出了一個(gè)最為形象的注解。
顧捷同樣認(rèn)為通用人工智能大模型與人形機(jī)器人是一次完美的解決,“AI公司做的相當(dāng)于是靈魂和大腦,但它一定需要一個(gè)身體來感知真實(shí)的物理世界,認(rèn)識(shí)這個(gè)世界,人形機(jī)器人相當(dāng)于是通用人工智能的最后一公里。”
智慧的大腦+靈活的身體,也將形成了通用人形機(jī)器人的終極形態(tài)。
正因如此,傅利葉智能實(shí)際上在今年也就公司定位進(jìn)行了一次調(diào)整,顧捷說,傅利葉智能現(xiàn)在聚焦通用人形機(jī)器人本體,未來要像為自動(dòng)駕駛公司提供汽車本體一樣,為AI公司提供通用人形機(jī)器人平臺(tái),而傅利葉智能也正式轉(zhuǎn)變?yōu)橐患彝ㄓ脵C(jī)器人公司。
2023年7月6日,傅利葉智能正式對(duì)外發(fā)布,傅利葉智能GR-1通用人形機(jī)器人,GR-1身高1.65米,體重55公斤,全身自由度達(dá)40個(gè),最大關(guān)節(jié)模組峰值扭矩可達(dá)300NM,步行速度可達(dá)到5KM/h,負(fù)重50公斤。
如果要說這款人形機(jī)器人與當(dāng)下國內(nèi)其它團(tuán)隊(duì)研發(fā)的人形機(jī)器人最大的不同是什么,那一定是量產(chǎn)能力了。
顧捷說,傅利葉智能要成為國內(nèi)第一家量產(chǎn)人形機(jī)器人的公司,傅利葉智能GR-1通用人形機(jī)器人,將會(huì)在今年年底正式實(shí)現(xiàn)量產(chǎn)發(fā)售。
好文章,需要你的鼓勵(lì)
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對(duì)弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。
關(guān)注智造、硬件、機(jī)器人。