作者 | 高飛
來(lái)源 | 科技行者
無(wú)疑,我們正處于一個(gè)AI重寫(xiě)一切的時(shí)代,重寫(xiě)的對(duì)象,自然也包括有“智能”兩個(gè)字作為前綴的“智能手機(jī)”。顯然,智能手機(jī)操作系統(tǒng)AI化(或者說(shuō)AI OS),在其中的重要性就幾乎無(wú)需多言。
首先,從技術(shù)層面講,手機(jī)OS是AI在端側(cè)設(shè)備落地的首要承載,正好是“ChatGPT”這種云側(cè)AI的相對(duì)面;
其次,從應(yīng)用層面講,手機(jī)上的AI,也是每一個(gè)消費(fèi)者在使用距離上最近(就在手中),和使用時(shí)間最長(zhǎng)的AI(時(shí)刻不離)。而提供交互界面、和軟硬件資源管理的,是操作系統(tǒng)。因此,AI化的OS本身,其實(shí)也可以看作是消費(fèi)者所使用的第一款“基礎(chǔ)AI應(yīng)用”。
說(shuō)到AI,大家總會(huì)談到一個(gè)時(shí)間節(jié)點(diǎn)“ChatGPT時(shí)刻”。而昨天榮耀召開(kāi)發(fā)布會(huì),“發(fā)布行業(yè)首個(gè)搭載智能體的個(gè)人化全場(chǎng)景AI操作系統(tǒng)——MagicOS 9.0,推出全新自研魔法大模型家族,宣布YOYO助理正式升級(jí)為YOYO智能體”,這個(gè)AI三連招,自然是一個(gè)非常值得關(guān)注的標(biāo)志性事件。
不過(guò),我并不想把這些重要事件講得似乎是橫空出世。似乎AI世界的一切,都是在某一天開(kāi)始了新的劇情。因?yàn)?,重要的東西,往往不是一蹴而就的。相反,它可能是時(shí)間沉淀的結(jié)果。
今年1月份,榮耀CEO趙明獲選中國(guó)經(jīng)濟(jì)新聞人物(2023-2024),他在獲選感言中說(shuō),“(榮耀)不是一個(gè)盆栽,從一個(gè)地方挪到另外一個(gè)地方,應(yīng)該是一棵大樹(shù),砍掉了相對(duì)粗壯的枝丫插在土里,這時(shí)候的榮耀需要重新構(gòu)建自己的體系,要重新把根扎在土里。”
在一次榮耀技術(shù)溝通會(huì)上,我也在一份資料中看到榮耀自己說(shuō),在AI整個(gè)大時(shí)代,它們是用AI在重構(gòu)整個(gè)操作系統(tǒng),呈現(xiàn)的正是一個(gè)種樹(shù)的過(guò)程。所以,我想用“種樹(shù)”的邏輯,來(lái)談一談對(duì)這次MagicOS 9.0發(fā)布的體會(huì)。
第一重理解:
從技術(shù)角度說(shuō),要讓AI OS成為一棵參天大樹(shù),需要堅(jiān)實(shí)的技術(shù)根基。而這個(gè)扎根的過(guò)程,自然不是短時(shí)間內(nèi)可以完成的。
兩年前MagicOS 7.0的時(shí)候,榮耀提到了在發(fā)展與AI關(guān)系密切的根技術(shù),包括Magic Live智慧引擎、MagicRing信任環(huán),和以“懂你”為設(shè)計(jì)目的的YOYO建議等。這些根技術(shù),都和今天的MagicOS 9.0,有直接性的關(guān)聯(lián)。
這次MagicOS 9.0更新,榮耀又在這個(gè)技術(shù)根基上,做了很多功課,比如打造大模型驅(qū)動(dòng)的AI內(nèi)核。而這一根基,與智能體驅(qū)動(dòng)的AI交互,和面向未來(lái)的開(kāi)放服務(wù)構(gòu)建的AI生態(tài)息息相關(guān)。
具體來(lái)說(shuō),MagicOS 9.0打造了全新的魔法大模型家族,這樣的大模型家族涵蓋大語(yǔ)言模型、圖像大模型、語(yǔ)音大模型、多模態(tài)大模型,參數(shù)規(guī)模橫跨500萬(wàn)-30億。
值得一提的是,和上一代MagicOS 8.0推出的70億參數(shù)規(guī)模的魔法大模型相比,MagicOS 9.0上的30億參數(shù)規(guī)模的大模型加載速度提升了77%、出詞速度提升了500%、功耗降低了80%,ROM和RAM的占用也得到大幅下降。
這正是榮耀在AI內(nèi)核上做的一系列工作使然。
第二重理解:
從生態(tài)的角度,種樹(shù)意味著“有所為有所不為”。
榮耀這幾年一直在談平臺(tái)級(jí)AI,并將端側(cè)AI分為四層架構(gòu)。
第一層是AI使能跨設(shè)備和跨系統(tǒng)的融合,第二層是用AI來(lái)重構(gòu)操作系統(tǒng),第三層、第四層是AI的應(yīng)用層,以及AI的端云協(xié)同。
這四層架構(gòu),后來(lái)也逐漸成為很多手機(jī)廠(chǎng)商,甚至包括蘋(píng)果在內(nèi)的公司跟進(jìn)的端側(cè)AI技術(shù)邏輯。
不過(guò),這四個(gè)層次中,榮耀投入的力度并不同,它將第一層、第二層作為自己的重點(diǎn)。因?yàn)檫@才是更接近手機(jī)底層使用的技術(shù)。而AI應(yīng)用等三四層,更多和智能手機(jī)能安裝、承載哪些AI類(lèi)型的APP有關(guān)。
總結(jié)來(lái)說(shuō),手機(jī)上有哪些AI應(yīng)用可以用,是第三四層的工作,但是手機(jī)自身會(huì)有多智能,是第一二層的事,也是一個(gè)手機(jī)廠(chǎng)商的基本使命所在。
而榮耀在AI OS中的第一層和底層工作,如果要用一個(gè)詞來(lái)定義,我覺(jué)得是榮耀一直在講的是:“懂你”。
所謂“懂你”,是指榮耀所打造的是一個(gè)非常個(gè)人化的OS,能夠在消費(fèi)者使用手機(jī)的過(guò)程中,構(gòu)建多維度的個(gè)人學(xué)習(xí)能力,在端側(cè)構(gòu)建個(gè)人知識(shí)庫(kù)。
這些懂你的創(chuàng)新,已經(jīng)幫消費(fèi)者創(chuàng)造了很多便利。
早在MagicOS 7.0上,榮耀就實(shí)現(xiàn)了跨設(shè)備和跨系統(tǒng)的AI,提出了用AI重做操作系統(tǒng),真正讓手機(jī)系統(tǒng)實(shí)現(xiàn)了可進(jìn)化。
在隨后的MagicOS 8.0上,榮耀又將大模型能力引入到操作系統(tǒng)中,不僅強(qiáng)化了操作系統(tǒng)的各項(xiàng)能力,還將意圖識(shí)別能力帶入到了操作系統(tǒng)中,這讓榮耀任意門(mén)、YOYO建議、靈動(dòng)膠囊這些獨(dú)特應(yīng)用的準(zhǔn)確性,乃至用戶(hù)體驗(yàn)遠(yuǎn)遠(yuǎn)超越了同期的操作系統(tǒng)。
這次,榮耀MagicOS 9.0又在這個(gè)懂你的基礎(chǔ)上,向前邁了一大步,就是“幫你”,也就是通過(guò)“智能體”——Agent的方式,不但能理解用戶(hù)的需求意圖“懂你”,還可以直接幫助用戶(hù),通過(guò)“自動(dòng)駕駛”的方式,將這個(gè)意圖具體實(shí)現(xiàn)。
所謂“自動(dòng)駕駛”,是指YOYO智能體在聽(tīng)到用戶(hù)的語(yǔ)音或收到文本指令之后,不需要用戶(hù)自己進(jìn)行一些繁瑣的操作,就可以自動(dòng)由YOYO智能體幫用戶(hù)調(diào)用后端APP、服務(wù)或功能,橫向關(guān)聯(lián)不同應(yīng)用,縱向到APP菜單深處操作,幫助用戶(hù)實(shí)現(xiàn)一系列功能。
用一個(gè)點(diǎn)咖啡的例子來(lái)說(shuō)明會(huì)比較形象。
很多用戶(hù)日常在使用手機(jī)APP下單點(diǎn)咖啡時(shí),需要先進(jìn)入APP或小程序,再找你想要的咖啡類(lèi)型,之后還需要選擇口味、是否加糖等,最后才到支付頁(yè)面,這套流程下來(lái),往往也需要不少耐心。
現(xiàn)在,榮耀手機(jī)的“自動(dòng)駕駛”YOYO智能體,只需要一個(gè)命令,甚至像“幫我點(diǎn)點(diǎn)兒喝的吧,我有點(diǎn)困了”這樣模糊的指令,就可以幫助用戶(hù)點(diǎn)一杯你想要的咖啡。
要注意的是,在這個(gè)過(guò)程當(dāng)中,其實(shí)智能體并無(wú)現(xiàn)成的API可以調(diào)用。實(shí)際上,它需要學(xué)習(xí)用戶(hù)屏幕上的內(nèi)容,自己形成上下文,拆解、編排任務(wù),從而模擬消費(fèi)者進(jìn)行相應(yīng)的操作。
這其中的AI工作流極為復(fù)雜,需要模型意圖理解、復(fù)雜任務(wù)規(guī)劃、任務(wù)自動(dòng)執(zhí)行幾個(gè)關(guān)鍵部分,才能最終實(shí)現(xiàn)智能體驅(qū)動(dòng)純AI視覺(jué)的三方零適配自主執(zhí)行。
榮耀產(chǎn)品線(xiàn)總裁方飛在接受采訪(fǎng)時(shí)告訴《科技行者》,“大家看到的通用大模型也具備任務(wù)拆解能力,但通常端到端只能做到60%-70%的準(zhǔn)確率,要真正應(yīng)用到終端產(chǎn)品中,我們往往需要的是95%以上的準(zhǔn)確率,這就需要我們深入去做模型微調(diào)、數(shù)據(jù)優(yōu)化等工作,這也是體現(xiàn)我們核心價(jià)值的地方,另外,我們還需要考慮效率的問(wèn)題,需要我們?cè)谛阅芎湍P鸵?guī)模上做很好的平衡。”
正是在這一系列技術(shù)上的深耕,讓榮耀的MagicOS 9.0實(shí)現(xiàn)了L3級(jí)的“自動(dòng)駕駛”,值得一提的是,這一“自動(dòng)駕駛”能力也經(jīng)過(guò)了信通院的權(quán)威認(rèn)證,被認(rèn)證為迄今最高的終端智能化等級(jí)。
不過(guò),其實(shí)我更想強(qiáng)調(diào)的,也是文章開(kāi)篇我提到的,是我對(duì)“種樹(shù)”的第三重理解。
也就是說(shuō),榮耀的MagicOS的AI鍛造之旅中,雖然有今天MagicOS 9.0這樣一個(gè)重要發(fā)布節(jié)點(diǎn),但卻并不存在一個(gè)完全特殊的“重要時(shí)刻”。
相反,一切都都是日積月累,堅(jiān)持長(zhǎng)期主義的過(guò)程,正如一棵參天大樹(shù)的成長(zhǎng)非一日之功。
如果大家查閱歷史資料,就會(huì)發(fā)現(xiàn)早在2016年,榮耀Magic系列手機(jī)初代發(fā)布的時(shí)候,智能一詞就已經(jīng)融入其中。
在當(dāng)時(shí)的一個(gè)官方報(bào)道中,有這樣一句話(huà)我摘錄給大家,“相較于EMUI,Magic Live系統(tǒng)的界面采用了全新的設(shè)計(jì)風(fēng)格。更重要的是,Magic Live提供了更智慧的交互、服務(wù)以及信息呈現(xiàn)的體驗(yàn)。”相信大家會(huì)認(rèn)同,這句話(huà)即使放在當(dāng)下,也并不過(guò)時(shí)。
榮耀的長(zhǎng)期主義,讓我想到了一個(gè)古希臘神話(huà)中的一個(gè)哲學(xué)名詞——“忒修斯之船“。
“忒修斯之船”說(shuō)得是,如果一艘船,在航行的過(guò)程中,每一塊木板都被逐一替換后,當(dāng)它到達(dá)彼岸的時(shí)候,所有模板都被替換完畢,它還是原來(lái)的那艘船嗎?
這個(gè)問(wèn)題探討的其實(shí)是,在事物的發(fā)展變化過(guò)程中,它是否還能保持其核心身份與目的。
在我看來(lái),榮耀手機(jī)的AI OS一系列迭代,就是一個(gè)忒修斯之船的“現(xiàn)實(shí)重演“。
從2016的初代Magic引入智慧引擎,到與ChatGPT同歲的MagicOS 7.0,和年初具備“任意門(mén)”功能的版本8.0,再到今天的MagicOS 9.0,隨著操作系統(tǒng)的不斷升級(jí),榮耀手機(jī)正在全方位智能化,而組成這部手機(jī)的各個(gè)部分,如所支持的硬件、算法等,都在不斷地被優(yōu)化和更新,這就像忒修斯之船中的木板一樣被逐一替換。
在這個(gè)過(guò)程中,船上的乘客,也就是手機(jī)消費(fèi)者,其實(shí)并不會(huì)意識(shí)到在哪個(gè)瞬間,可以作為榮耀AI的“ChatGPT時(shí)刻”。
但是大家會(huì)逐漸發(fā)現(xiàn),手中的手機(jī)已經(jīng)并非原來(lái)的物種,而是在不知不覺(jué)中自下而上完成了迭代更新,成了越來(lái)越懂你和逐漸可以幫你的AI硬件。
我們可以用亞里士多德的“形式因”,“質(zhì)料因”,“動(dòng)力因”,“目的因”的四因理論,來(lái)做更進(jìn)一步的詮釋。
“形式因”,“質(zhì)料因”是一個(gè)事物的材料組成和表現(xiàn)形式,而動(dòng)力因、目的因,則是這些“組成表現(xiàn)”的內(nèi)在驅(qū)動(dòng)和使命目標(biāo)。
對(duì)于MagicOS,以及操作系統(tǒng)之上的榮耀智能手機(jī)而言,軟硬件、算法、模型都屬于這艘“消費(fèi)電子忒修斯“的“質(zhì)料因“、“形式因”部分。
而“質(zhì)料因“、“形式因”的迭代,是沒(méi)有“ChatGPT”時(shí)刻的,因?yàn)槊恳豢潭己苤匾?/p>
我們更需要強(qiáng)調(diào)的是,對(duì)于消費(fèi)者來(lái)說(shuō),這些“組件”更新哪怕外在面貌變化再大,比如從當(dāng)年的直板機(jī),到后來(lái)的折疊機(jī),也不會(huì)感受任何的“違和感”,而是一脈相承。
這是因?yàn)?,榮耀AI的“動(dòng)力因“和”目的因“一直都沒(méi)有變化,一直是”越來(lái)越好用“,“越好越懂你”。
懂你,也在第九個(gè)版本這一代,從“懂你”升級(jí)為進(jìn)一步的“幫你”。
所以,雖然組件變了,但“忒修斯”還是“忒修斯”,“Magic”還是“Magic”。
從“懂你”升級(jí)到“幫你”, Magic真正在變的,是越來(lái)越聰明。
對(duì)于榮耀手機(jī)的消費(fèi)者來(lái)說(shuō),對(duì)榮耀智能體愈加聰明只會(huì)愈加開(kāi)心。
因?yàn)辄c(diǎn)一杯日常要喝的咖啡,和查詢(xún)付費(fèi)訂閱,并不是一個(gè)正常消費(fèi)者所愿意親手做的事情。
相反,這些工作,都是一些消費(fèi)者會(huì)做,但是不想做,或者是想做,但是不了解如何做的事情。
如果讓我用一個(gè)正常生活中的例子來(lái)做比喻,大概就是刷碗了。
現(xiàn)在,通過(guò)看到智能體,智能手機(jī)已經(jīng)能夠“自動(dòng)駕駛”的幫消費(fèi)者搞定這些麻煩事兒,中國(guó)的手機(jī)用戶(hù)因此提前看到了未來(lái)手機(jī)操作系統(tǒng)的樣子。
大概,這也是AI最美好的樣子。
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開(kāi)發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺(jué)解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺(jué)語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺(jué)信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。