作者|周雅
如果四年前被推上臺(tái)前的鴻蒙1.0,還只是構(gòu)圖簡(jiǎn)單的“Try it Possible”,那么如今的鴻蒙4.0,已經(jīng)可以讓華為終端BG CEO、智能汽車(chē)解決方案BU CEO余承東一臉從容的念出“Make it Possible”。
Make It Possible(以行踐言),是華為消費(fèi)者業(yè)務(wù)10年前對(duì)外公布的品牌理念,其實(shí)在每一年的華為開(kāi)發(fā)者大會(huì)(HDC),這個(gè)口號(hào)都會(huì)響徹全場(chǎng),但是今年鴻蒙4的到來(lái),卻讓這話聽(tīng)起來(lái)多了一絲堅(jiān)定意味。
自初出茅廬,鴻蒙就開(kāi)辟了一條極具特色的基調(diào),有別于通信領(lǐng)域——手機(jī)操作系統(tǒng)的iOS、Android,也不是計(jì)算領(lǐng)域——桌面操作系統(tǒng)的Windows、MacOS,它更是一個(gè)“橫跨通信與計(jì)算兩大技術(shù)領(lǐng)域的,面向智能全場(chǎng)景的分布式系統(tǒng)”。從我們一直以來(lái)的觀察看,鴻蒙從第一代起,它定下的基調(diào),就是——
面向人與人、物與物、人與物三種交互場(chǎng)景并進(jìn)的「新交互方式」演進(jìn)之路。
物理世界到數(shù)字世界的“橋”
操作系統(tǒng)有我們看不見(jiàn)的一面,是對(duì)計(jì)算系統(tǒng)底層資源的管理。但是對(duì)于大多數(shù)用戶(hù)而言,操作系統(tǒng)看得見(jiàn)的另一面,則更為重要,它就是——人機(jī)交互方式。
操作系統(tǒng),本質(zhì)上是連接硬件與軟件、人與機(jī)器的橋。而每一個(gè)操作系統(tǒng)的交替,都伴隨著人機(jī)交互方式的革新。
「鍵盤(pán)」承擔(dān)了這個(gè)使命最長(zhǎng)的歲月。在古老的MS-DOS和Unix時(shí)代,人們通過(guò)鍵盤(pán)輸入命令,盡管這種方式在當(dāng)時(shí)已經(jīng)足夠先進(jìn),但它既復(fù)雜性又不直觀,對(duì)普通用戶(hù)來(lái)說(shuō)是一道障礙。計(jì)算機(jī)的早期用戶(hù),上機(jī)之前幾乎都要先進(jìn)行打字軟件的訓(xùn)練。
后來(lái)出現(xiàn)的Windows和MacOS,讓人機(jī)交互方式從「鍵盤(pán)和命令行」進(jìn)化到「圖形用戶(hù)界面和鼠標(biāo)」。到了移動(dòng)互聯(lián)網(wǎng)時(shí)代,Android和iOS通過(guò)觸摸界面,又讓「觸屏交互」成為主流??梢哉f(shuō),當(dāng)年智能手機(jī)出現(xiàn)的奇點(diǎn)轟動(dòng),離不開(kāi)“多點(diǎn)觸控”這一開(kāi)創(chuàng)性的人機(jī)交互方式。
顯然,從鍵盤(pán)鼠標(biāo)、到觸摸屏、到語(yǔ)音,每一次人機(jī)交互方式的轉(zhuǎn)變,都是一次操作系統(tǒng)使用效率的提升。
在HDC2023,鴻蒙4(HarmonyOS 4)強(qiáng)調(diào)了它的六項(xiàng)創(chuàng)新能力——分布式、原子化(元服務(wù))、智慧(盤(pán)古大模型)、流暢(方舟引擎)、安全、個(gè)性。
其中,「分布式」不用多說(shuō),它是鴻蒙開(kāi)天辟地的亮點(diǎn),意味著各種設(shè)備能夠在一個(gè)系統(tǒng)中協(xié)同工作,手機(jī)、電腦、平板、智能穿戴、微波爐、冰箱等可以一鍵互聯(lián)、無(wú)縫切換,像是在終端之間建了一條高速公路,它們共享資源、共享信息、協(xié)同工作,形成了一個(gè)完整系統(tǒng)。
但鴻蒙4的六藝之中,最讓我們感觸最深的,其實(shí)是它最新實(shí)現(xiàn)的一項(xiàng)能力:「智慧」,鴻蒙4通過(guò)內(nèi)置盤(pán)古大模型,讓語(yǔ)音助手“小藝”脫胎換骨。
如果說(shuō)我們可以將分布式定義為鴻蒙的一個(gè)支點(diǎn),讓物與物交互地更好。那么AI就相當(dāng)于是鴻蒙的另一個(gè)支點(diǎn),可以讓人與物交互地更好。左手分布式、右手AI,兩個(gè)支點(diǎn)的連線,構(gòu)成了鴻蒙發(fā)展的一條主線。
華為盤(pán)古大模型的能力,則是鴻蒙新支點(diǎn)的底座。自然語(yǔ)言能力的加持,讓人機(jī)交互第一次不是以人適應(yīng)機(jī)器的方式進(jìn)行,而是機(jī)器適應(yīng)人的方式進(jìn)行。
換言之,大模型出現(xiàn)后,自然語(yǔ)言成為了人機(jī)交互的新媒介,計(jì)算機(jī)第一次“直接”理解了人類(lèi)語(yǔ)言,而可以借由復(fù)雜的軟硬中間件,這種“直接”,讓人機(jī)交互離“自然交互”又近了一點(diǎn)。
不過(guò)需要強(qiáng)調(diào)的是,盡管我們一直在說(shuō)大模型,小藝跟我們?nèi)粘S玫腃hatGPT、文心一言等AI工具是不同的,后者是通過(guò)調(diào)用云端算力,實(shí)現(xiàn)了圖靈測(cè)試級(jí)交流的通用工具;而小藝,則是云端和終端相互配合,把手機(jī)等移動(dòng)終端的算力資源利用起來(lái),去匹配個(gè)人用戶(hù)的智慧全場(chǎng)景需求,成了操作系統(tǒng)的一個(gè)智能化身。
它是操作系統(tǒng)界面的一大進(jìn)化,也開(kāi)創(chuàng)了人機(jī)交互的一個(gè)先河。
同樣參與了這次HDC2023的和鯨科技CEO范向偉在其中一場(chǎng)分論壇中提到:“小藝的特殊之處在于,此前國(guó)內(nèi)沒(méi)有一家同類(lèi)廠商,能夠在消費(fèi)者終端,提供這樣普適的用戶(hù)需求。”
按照華為的官方說(shuō)法,盤(pán)古大模型主要在三個(gè)方向增強(qiáng)了小藝的能力——智慧交互(更聰明)、高效生產(chǎn)力(更能干)、個(gè)性化服務(wù)(更貼心)。而拆解來(lái)看,小藝的三個(gè)能力,似乎可以給人機(jī)交互的進(jìn)化帶去兩個(gè)思路。
思路1:它是操作系統(tǒng)的化身。
人與人在交流過(guò)程中,通過(guò)說(shuō)話、眼神、肢體動(dòng)作都可以,怎么自然怎么來(lái)。同理,人機(jī)交互的方式,其實(shí)也不用只局限于單一的一種。升級(jí)后的小藝,能在語(yǔ)音交互的原有基礎(chǔ)上,新增了文字、圖片、文檔等多種交互形式,它是一種自然的交流。
第一,小藝有強(qiáng)大的理解能力。例如,你想要把換成天氣壁紙,可是記不起來(lái)功能名字,或者不知道在哪個(gè)菜單欄里去找,這時(shí)候只需要問(wèn)小藝“怎么換一個(gè)帶天氣效果的壁紙?”,或者直接說(shuō)“把手機(jī)壁紙?jiān)O(shè)置成實(shí)時(shí)天氣。”只要意思表達(dá)到了,小藝都能聽(tīng)懂,然后自動(dòng)幫你換好。
或者,假設(shè)此時(shí)的你在某處看到一篇英文論文,但你來(lái)不及完整的看完,這就可以讓小藝?yán)斫膺@篇英文論文、再提煉出中文摘要,甚至,你可以挑其中某個(gè)關(guān)鍵詞問(wèn)它,小藝會(huì)到論文中去找答案,精簡(jiǎn)之后再回答你。
第二,小藝有一定的創(chuàng)作能力。鴻蒙4的創(chuàng)新之處在于,小藝融合了AIGC的能力,可以做一些摘要總結(jié)、信息檢索、多語(yǔ)種翻譯、郵件擬寫(xiě)、內(nèi)容創(chuàng)作等工作,帶來(lái)生產(chǎn)效率的提升。
比如開(kāi)會(huì)場(chǎng)景,你要向甲方發(fā)一份會(huì)邀,就可以讓小藝幫你快速生成一份商務(wù)版的郵件;再比如圖像場(chǎng)景,基于多模態(tài)的能力,用戶(hù)可以直接選中手機(jī)中的圖片或者一些廢片,召喚出小藝,告訴它喜歡什么風(fēng)格的藝術(shù)創(chuàng)作,讓小藝進(jìn)行二次創(chuàng)作,可以直接得到一張藝術(shù)風(fēng)格的圖像。
這樣的功能,雖然在ChatGPT等聊天機(jī)器人應(yīng)用中很常見(jiàn),但小藝的調(diào)用是基于操作系統(tǒng)層面,這就比“先把會(huì)邀或圖像發(fā)送到某個(gè)聊天機(jī)器人的對(duì)話框里-再寫(xiě)一段prompt-最后再得到答案“要方便多了。因?yàn)閳?chǎng)景自身,已經(jīng)天然構(gòu)成了prompt的上下文。
第三,小藝相當(dāng)于一個(gè)超級(jí)應(yīng)用。傳統(tǒng)的語(yǔ)音助手,僅僅停留在“用戶(hù)發(fā)出一次指令、它完成一次指令”的簡(jiǎn)單操作,而鴻蒙4的創(chuàng)新之處在于,小藝不但具有大模型的泛化能力,還可以與手機(jī)功能進(jìn)行聯(lián)動(dòng)。
比如存檔場(chǎng)景,你可以直接給小藝發(fā)一張圖片,讓小藝按照?qǐng)D片里的文字添加會(huì)議時(shí)間提醒,或者將圖片里的聯(lián)系人信息直接添加到手機(jī)通訊錄中;或者用餐場(chǎng)景,你晚上想請(qǐng)人吃飯,可以直接告訴小藝“找一家在松山湖附近評(píng)分比較高的海鮮餐廳,最好有適合 4 個(gè)人的優(yōu)惠套餐”,小藝可以直接調(diào)取美團(tuán)服務(wù)。
小藝之所以既能聽(tīng)懂自然語(yǔ)言,又能調(diào)用手機(jī)應(yīng)用,背后有兩個(gè)關(guān)鍵因素。華為終端BG AI與智能全場(chǎng)景業(yè)務(wù)部總裁賈永利解釋道,一方面,大語(yǔ)言模型具備泛化能力,能夠幫助智能助手提升理解能力。另一方面,大模型Plug-in的插件能力,可以在手機(jī)內(nèi)部打通各應(yīng)用之間的壁壘,借助工具拓展能力。
思路2:它是個(gè)人模型的化身。
小藝不僅代表了操作系統(tǒng)的底層功能,是終端交互的新界面,它其實(shí)也是用戶(hù)的數(shù)字化身,讓機(jī)器更懂我們。
華為指出,小藝將擁有一個(gè)強(qiáng)大的能力「記憶能力」,隨著長(zhǎng)時(shí)間的陪伴,小藝會(huì)越來(lái)越懂你,那么它給出的「小藝建議」也會(huì)更貼心。
比如父母的金婚紀(jì)念日,用戶(hù)可以告訴小藝幫他記住,并且提前兩周時(shí)間提醒用戶(hù)準(zhǔn)備,那么“小藝建議”會(huì)在臨近之時(shí)推出一張應(yīng)用組合卡片,里面聚合了訂餐信息、禮物導(dǎo)購(gòu)、生日策劃等信息。
比如針對(duì)經(jīng)常出差的用戶(hù)。假設(shè)你即將去納米比亞出差,在訂票過(guò)程中曾經(jīng)與小藝交流過(guò),那么當(dāng)真正出差的時(shí)候,小藝建議會(huì)自動(dòng)生成一個(gè)“納米比亞之旅”的出行卡,里面聚合了天氣預(yù)報(bào)、行程攻略、打車(chē)服務(wù)等應(yīng)用,且這些都是你習(xí)慣的應(yīng)用。
再比如針對(duì)喜歡跑步的用戶(hù)。小藝可以根據(jù)你用自然語(yǔ)言發(fā)出的需求,基于自己的編程能力,自動(dòng)創(chuàng)建出一個(gè)完整的晨跑場(chǎng)景:每天早上6:30幫我播報(bào)天氣,6:30-7:00如果我?guī)纤{(lán)牙耳機(jī),就自動(dòng)播放我收藏的音樂(lè),并把手機(jī)調(diào)成靜音。小藝接收指令,并且每天照做。
華為強(qiáng)調(diào),所有這些相關(guān)的數(shù)據(jù)和學(xué)習(xí),都是在端側(cè)推理,以保障用戶(hù)的安全和隱私。“AI 大模型技術(shù)的發(fā)展,將會(huì)帶來(lái)下一代智能終端操作系統(tǒng)的智慧體驗(yàn)。”余承東在會(huì)上強(qiáng)調(diào)。
當(dāng)然,無(wú)論是哪種化身,作為一種新智能體,它需要持續(xù)持續(xù)進(jìn)化的能力。這方面,小藝得益于華為技術(shù)棧的底層加持。
據(jù)悉,小藝的大模型,基于盤(pán)古L0大模型+終端消費(fèi)者的場(chǎng)景數(shù)據(jù)和精調(diào)模型后的L1層對(duì)話模型。所謂盤(pán)古大模型(盤(pán)古Chat),是華為自研的大模型,它近期另一項(xiàng)輝煌成就,來(lái)自它在天氣預(yù)報(bào)中的表現(xiàn):今年7月初,《自然》雜志發(fā)表了華為《三維神經(jīng)網(wǎng)絡(luò)用于精準(zhǔn)中期全球天氣預(yù)報(bào)》論文,論文中顯示,盤(pán)古氣象大模型是首個(gè)精度超過(guò)傳統(tǒng)數(shù)值預(yù)報(bào)方法的AI模型,速度相比傳統(tǒng)數(shù)值預(yù)報(bào)提速1萬(wàn)倍以上。
《自然》評(píng)價(jià)認(rèn)為:“盤(pán)古氣象大模型讓人們重新審視氣象預(yù)報(bào)模型的未來(lái)。”顯然,盤(pán)古大模型將對(duì)小藝帶來(lái)持續(xù)增益。
“現(xiàn)在每個(gè)月至少有2億手機(jī)用戶(hù)與小藝交互。在搭載鴻蒙座艙的汽車(chē)中,87.6%的座艙操作都由小藝完成。每臺(tái)智慧屏小藝平均每天被喚醒7次。”華為終端BG首席運(yùn)營(yíng)官何剛分享了這樣一組數(shù)據(jù)。而有了大模型,小藝的未來(lái),可能不再需要喚醒,而是常駐。
生態(tài)成,則鴻蒙成
不過(guò),鴻蒙究竟能否能引領(lǐng)操作系統(tǒng)變革,除了技術(shù)精進(jìn)之外,還需要一個(gè)必要條件,它就是生態(tài)。
鴻蒙操作系統(tǒng)的誕生,起源是在制裁的重壓下一條拓荒之路,而華為正以自己的方式向外界證明,企業(yè)若要走出一條屬于自己的路,就必須構(gòu)建“根”和“魂”。“根”是生態(tài),不可動(dòng)搖;“魂”是創(chuàng)新,不可停歇。
在這次HDC2023臨近結(jié)束,華為終端BG軟件部總裁龔體表示,“如果說(shuō)打造一套成熟的操作系統(tǒng)需要有堅(jiān)實(shí)的底座、繁榮的生態(tài)、極致的體驗(yàn)的話,那么,鴻蒙已經(jīng)完成了兩大戰(zhàn)役,還剩一個(gè)戰(zhàn)役是生態(tài),生態(tài)成則鴻蒙成。”
操作系統(tǒng)的生態(tài),是由多個(gè)組成部分構(gòu)成,包括但不限于硬件制造商、軟件開(kāi)發(fā)者、最終用戶(hù)、以及其他相關(guān)合作伙伴。這些不同的組成部分相互協(xié)作、共同支持,也推動(dòng)操作系統(tǒng)的成功。生態(tài),不是企業(yè)的一畝三分地,而是趨于持續(xù)擴(kuò)大、持續(xù)創(chuàng)新的圈。
所幸,鴻蒙生態(tài)也在路上。“截至目前,搭載鴻蒙生態(tài)設(shè)備超過(guò)7億臺(tái),HarmonyOS注冊(cè)開(kāi)發(fā)者達(dá)到220萬(wàn)以上,API日調(diào)用達(dá)到590億次以上,開(kāi)發(fā)工具DevEco活躍用戶(hù)數(shù)超過(guò)40萬(wàn)人。”余承東分享說(shuō)道。
中國(guó)農(nóng)業(yè)銀行研發(fā)中心副總經(jīng)理徐偉在HDC2023現(xiàn)場(chǎng)演講時(shí),提到了農(nóng)業(yè)銀行手機(jī)銀行搭載鴻蒙操作系統(tǒng)的心得:“之所以選擇鴻蒙,主要是兩方面因素,一方面,我們統(tǒng)計(jì)了現(xiàn)有客戶(hù)的手機(jī)類(lèi)型,有超過(guò)20%以上的用戶(hù)使用搭載鴻蒙的設(shè)備。另一方面。鴻蒙的萬(wàn)物智能理念符合未來(lái)趨勢(shì),潛力巨大。”
根據(jù)Counterpoint數(shù)據(jù)顯示,在中國(guó)智能手機(jī)市場(chǎng),2021年三季度,鴻蒙系統(tǒng)份額僅為1%,而安卓、iOS的份額分別為86%、13%。到2023年一季度,鴻蒙份額升至8%,而安卓和蘋(píng)果分別是72%、20%。
圖來(lái)自Counterpoint中國(guó)智能手機(jī)操作系統(tǒng)市場(chǎng)份額
而華為消費(fèi)者業(yè)務(wù)AI與智慧全場(chǎng)景業(yè)務(wù)部副總裁楊海松曾公開(kāi)說(shuō):“對(duì)于一個(gè)生態(tài)來(lái)講,特別是操作系統(tǒng)這類(lèi)的底層平臺(tái),軟件使用量、市場(chǎng)占有率是它能否活下來(lái)、能否成功的最核心的因素,16%的市占率是一個(gè)生死線。”
所以,鴻蒙還需再翻番,而AI可能就是新的加速踏板。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。