一個時代有一個時代的產業(yè)主旋律,AI+連接就是在全球任何一個角落也會占據(jù)絕對C位的技術組合。
說到AI和連接的“頭條效應”,不久前在巴塞羅那落幕的MWC(2024世界移動通信大會)無疑是個最能體現(xiàn)這一趨勢的舞臺,并釋放出更多創(chuàng)新信號:
1、2024年是5G進入商用第5年,5G-A已蓄勢待發(fā);2、終端已經(jīng)從“移動計算終端”進化為“智能計算終端”,甚至是“無手機不AI、無PC不AI”;3、中國企業(yè)繼續(xù)閃耀全場,從產品出發(fā)到場景落地。
而MWC大會的常客——高通,就在今年的MWC上展示了如何將“連接”做到極致,又前瞻性早早布局“AI”,一直緊跟技術變革趨勢不斷發(fā)展演進。
01 做好“連接”:5G+AI是智能世界的鋼筋水泥
如果說AI是眾多產業(yè)的領舞者,那么連接技術可能是推動AI走上舞臺的領舞者。不夸張的說,沒有移動互聯(lián)網(wǎng)所創(chuàng)造的數(shù)據(jù)洪流,就沒有接下來的模型世界。
連接,是萬物通信的紐帶,也是高通的基因所在,高通(Qualcomm)的全稱Quality+Communication,本身就意指高質量的通信,也等同于高質量的連接,從20世紀80年代開創(chuàng)無線連接能力,到5G時代成為引領者,高通一直在推動讓連接無處不在。
而連接技術本身,也從未停止過它的創(chuàng)新腳步。業(yè)界的共識是,2024年已是5G Advanced(簡稱5G-A)的重要開局之年。5G-A作為5G演進的第二階段,它不僅是向6G演進的關鍵階段,也是邁向“智能計算無處不在”時代的必由之路,對于推動生成式AI跨云端、邊緣側和終端側規(guī)?;瘮U展也至關重要。
那么如何擁抱最新的連接趨勢?從高通在MWC2024期間的最新技術發(fā)布便可看出一些端倪,我們不妨用三個“連接”作為關鍵詞來匯總。
1、連接一:連接“5G與AI”:高通在MWC2024期間推出第七代5G調制解調器及射頻系統(tǒng)——驍龍X80,它集成了專用5G AI處理器和5G Advanced-ready架構,實現(xiàn)了多項“全球首創(chuàng)”,包括:
· 首次在5G調制解調器中集成NB(窄帶)到NTN(非地面網(wǎng)絡),以支持衛(wèi)星通信;
· 首次面向智能手機支持6Rx,從而擴大射頻覆蓋范圍并提升連接性能;
· 首個在Sub-6GHz頻段實現(xiàn)下行六載波聚合;
· 首次面向固定無線接入客戶端設備(CPE)支持由AI賦能的毫米波增程通信。
“驍龍X80的創(chuàng)新在于,更好地利用帶寬提升用戶的實際連接體驗。例如,在用戶距離基站較遠等頗具挑戰(zhàn)的情況下,提高平均連接速率,而非專注于峰值速率的提升。”高通技術公司產品市場高級總監(jiān)Ignacio Contreras在MWC2024期間接受媒體采訪時介紹道。驍龍X80適用于多個5G-A場景,包括智能手機、移動寬帶、PC、XR、汽車、工業(yè)物聯(lián)網(wǎng)、專網(wǎng)和固定無線接入。
2、連接二:連接“開發(fā)者與AI大模型”:高通在MWC2024期間推出高通AI Hub,提供了超過75個預優(yōu)化AI模型的模型庫(比如Whisper、ControlNet、Stable Diffusion、Baichuan-7B等),支持開發(fā)者在搭載驍龍平臺的終端上進行無縫部署,縮短上市時間,發(fā)揮終端側AI部署的諸多優(yōu)勢,比如即時性、可靠性、隱私保護、個性化以及成本優(yōu)勢。上述模型現(xiàn)已在高通AI Hub、Hugging Face和GitHub上提供。
對于開發(fā)者來說,運用高通AI Hub,只需三步:首先,開發(fā)者選擇應用所需的模型(如Baichuan-7B),以及開發(fā)應用時所采用的框架(如Pytorch、Tensorflow);下一步,開發(fā)者需要確定自己的目標平臺,例如一款特定型號的手機;最后,確定以上信息后,高通AI Hub就可以為開發(fā)者提供面向其指定應用、指定平臺進行優(yōu)化的模型。也就是說,開發(fā)者只需要幾行代碼,就可以獲取模型,并將模型集成進應用程序。
而面向未來,高通更是主張為AI定制設計專屬的計算架構。3月6日,高通在最新發(fā)布的白皮書《通過NPU和異構計算開啟終端側生成式AI》中提及:
“隨著生成式AI應用需求不斷暴增,我們需要專為AI定制設計全新的計算架構。這首先需要一個面向生成式AI全新設計的神經(jīng)網(wǎng)絡處理器(NPU),同時要利用異構處理器組合,比如中央處理器(CPU)和圖形處理器(GPU)。異構計算能夠實現(xiàn)最佳應用性能、能效和電池續(xù)航,賦能全新增強的生成式AI體驗。”
正如在工具箱中選擇合適的工具一樣,選擇合適的處理器取決于諸多因素,將增強生成式AI體驗。(圖片來源/《通過NPU和異構計算開啟終端側生成式AI》白皮書)
NPU隨著不斷變化的AI用例和模型持續(xù)演進,實現(xiàn)高性能低功耗。(圖片來源/《通過NPU和異構計算開啟終端側生成式AI》白皮書)
Hexagon NPU是高通的異構計算架構一一高通AI引擎中的關鍵處理器,高通AI引擎還包括高通 Adreno GPU、高通 Kryo或高通 Oryon CPU、高通傳感器中樞和內存子系統(tǒng)。
白皮書指出,“高通NPU的差異化優(yōu)勢在于系統(tǒng)級解決方案、定制設計和快速創(chuàng)新。通過定制設計NPU并控制指令集架構(ISA),高通能夠快速進行設計演進和擴展,以解決瓶頸問題并優(yōu)化性能。”
圖為高通AI軟件棧,旨在幫助開發(fā)者一次編寫,即可實現(xiàn)隨時隨地運行和規(guī)?;瘮U展。
3、連接三:連接“Wi-Fi與多終端體驗”:高通在MWC2024期間還推出Wi-Fi 7解決方案FastConnect 7900,它的前代是高通在MWC 2022期間推出的首個Wi-Fi 7解決方案FastConnect 7800。
與前代相比,F(xiàn)astConnect 7900采用全新的射頻前端模組和架構,在降低40%系統(tǒng)功耗的同時提高能效;該系統(tǒng)還助力減少25%占板面積,從而留出更大的電池空間,以提升續(xù)航能力;此外,F(xiàn)astConnect 7900外形設計靈巧,大幅提升成本。
FastConnect 7900是全球首個AI增強的Wi-Fi系統(tǒng),集成了近距離感知功能。此外,這也是高通首次在單顆6納米制程工藝的芯片中集成藍牙、Wi-Fi 7和超寬帶功能,“這意味著,用一顆芯片就能夠實現(xiàn)競品三顆芯片所能達到的效果。”Ignacio Contreras指出,利用AI,F(xiàn)astConnect 7900可適應特定用例和環(huán)境,比如將藍牙用作數(shù)字鑰匙、借助超寬帶技術尋找物品、借助Wi-Fi實現(xiàn)室內導航等近距離感知應用場景。
此外,F(xiàn)astConnect 7900還能夠支持多終端體驗,例如將內容投射到屏幕或揚聲器、同時使用多個屏幕顯示、支持分離式渲染VR技術等。“通過高通獨有的兩大技術——Wi-Fi高頻并發(fā)技術(HBS)和高通擴展個人局域網(wǎng)(XPAN)技術,我們能夠帶來更出色的體驗。”Ignacio Contreras介紹說。
例如,通過Wi-Fi或藍牙將手機和耳機連接,可以擴大其覆蓋范圍,實現(xiàn)音頻流傳輸?shù)娜莞采w;同時,Wi-Fi高頻并發(fā)技術支持耳機和另一接入點同時在兩個5GHz頻段建立連接;此外,5GHz頻段支持更高的數(shù)據(jù)傳輸速率和吞吐量,從而實現(xiàn)無損音質。
02 場景賦能:萬物互聯(lián),到萬物智能背后的不變宗旨
毫無疑問,生成式AI已成為新物種演變的主旋律。但是大模型雖好,不能只在云端浮游,還需和消費者更近,門檻變得更低,才能真正實現(xiàn)“寒武紀大爆發(fā)”。
而如何讓模型變得更平易近人,自然是場景升級的核心議題。如同高通公司總裁兼CEO安蒙在MWC 2024期間表示:“混合AI是生成式AI的未來,終端側智能與云端協(xié)同工作,能夠提升個性化、隱私、可靠性和效率。
讓模型從云到端,高通的行動步伐正在加速。在去年MWC期間,高通帶來全球首個運行在Android手機上的Stable Diffusion終端側演示,實現(xiàn)了在15秒內執(zhí)行20步推理,生成一張512x512像素的圖像,這是當時在智能手機上最快的推理速度,能媲美云端時延,且用戶文本輸入完全不受限制。而在去年底,高通乘勝追擊推出第三代驍龍8,是首款支持端側運行100億參數(shù)AI大模型的移動芯片,支持以20 tokens/s的速度運行大模型。
在今年的MWC上,第三代驍龍8賦能的AI手機成為焦點,高通AI研究(Qualcomm AI Research)演示了多項最新成果,包括:
1、首個在Android智能手機上運行的大語言和視覺助理大模型LLaVA,這是一個超過70億參數(shù)的大型多模態(tài)語言模型(LMM),可接受包括文本、語音、圖像在內的多種類型的數(shù)據(jù)輸入,并能夠與AI助手生成關于圖像的多輪對話。
具有語言理解和視覺理解能力的LMM能夠賦能諸多用例,例如識別和討論復雜的視覺圖案、物體和場景。舉個例子,用戶可以拍一張食材的照片,向AI助手提問:這些食材都是什么?根據(jù)這些食材能夠做什么菜?每道菜的熱量是多少?
AI助手就能夠基于視覺內容提供豐富的信息,所有的功能完全在終端側運行,能夠以非常及時的響應速度生成token,并且更好地保護隱私。
2、高通首個在Android智能手機上運行的LoRA模型。通過運行支持LoRA的Stable Diffusion,用戶可基于個人或藝術偏好創(chuàng)建高質量自定義圖像。LoRA減少了AI模型的可訓練參數(shù)數(shù)量,賦能更加高效、可擴展、定制化的終端側生成式AI用例。
除了能夠實現(xiàn)針對不同的藝術風格賦能語言視覺大模型(LVM)微調外,LoRA還廣泛適用于定制AI模型(如大語言模型),以打造量身定制的個人助手、改進語言翻譯等。
除了上述AI手機的用例之外,AI PC上的新用例同樣引人矚目。高通在去年底發(fā)布了專為AI PC打造的驍龍X Elite平臺,它能支持在終端側運行超過130億參數(shù)的生成式AI模型。
今年MWC,高通演示了全球首個在Windows PC上運行的超過70億參數(shù)的LMM,可接受文本輸入、或基于音頻內容生成多輪對話,能理解鳥鳴、音樂或家中的不同聲音,比如,理解用戶輸入的音樂類型和風格,為用戶提供音樂的歷史以及相似的音樂推薦;或通過對話的方式,為用戶調節(jié)周圍的音樂。
誠然,高通展示最新的“麻辣”技術,合作伙伴的“滾燙”發(fā)布自然也不會缺席,無論是手機還是PC。
于是我們看到從去年起,內置AI大模型已經(jīng)成為旗艦手機的標配。比如小米 14 Ultra,搭載了首個AI大模型計算攝影平臺Xiaomi AISP,可實現(xiàn)60TOPS 的計算能力,帶來超級抓拍、超級底片功能;榮耀Magic6 Pro,支持70億參數(shù)的AI端側大模型,帶來Magic Portal等智慧體驗;OPPO 和 vivo 相繼發(fā)布了擁有端側大模型的Find X7系列和X100系列,實現(xiàn)了AIGC消除功能、AI大模型語音摘要等功能。
03 生態(tài)合力:鋪墊未來通信
和5G的生產力的貢獻一樣,如今,生成式AI變革也在加速數(shù)字化轉型,推動經(jīng)濟增長。根據(jù)麥肯錫數(shù)據(jù)顯示,生成式AI技術可使60多個用例每年實現(xiàn)2.6萬億至4.4萬億美元的總體經(jīng)濟效益增長,經(jīng)濟規(guī)模大致相當于英國2021年的GDP。
安蒙在MWC2024期間強調:“移動通信發(fā)展的一個核心目標就是要連接萬物,網(wǎng)絡在提供連接和感知能力的同時,也正成為全新的計算引擎。”
連接萬物需要強大的技術,而連接伙伴需要持續(xù)的經(jīng)營。從3G時代到5G時代,特別是移動互聯(lián)網(wǎng)時代開啟以來,每一次無線通信技術的演進,都有高通的身影,從標準制定、到產品迭代、到應用落地,高通全流程參與其中。
高通在MWC巴塞羅那2024期間的一系列先進無線技術演示
但是,高通也從來不是“一只龍在戰(zhàn)斗”。與高通站在一起的創(chuàng)新力量中,少不了生態(tài)伙伴的身影,尤其是中國伙伴。
在MWC2024,高通與中國伙伴的合作創(chuàng)新碩果累累,中國聯(lián)通、小米、榮耀、一加、TCL、廣翼智聯(lián)、廣和通、美格智能、移遠通信、芯訊通等眾多合作伙伴在MWC發(fā)布了基于高通和驍龍平臺打造的多款新品,包括Wi-Fi 7路由器、智能手機、平板、智能手表、耳機、消費和工業(yè)物聯(lián)網(wǎng)終端、5G智能模組和FWA解決方案等,讓智能計算和極速連接觸手可及,惠及更多行業(yè)和用戶。
具體而言包括但不限于:
TCL發(fā)布搭載驍龍X35的RedCap Dongle——TCL LINKKEY IK511;
美格智能推出基于驍龍X75的5G-A模組解決方案,以及搭載驍龍X72的5G-A FWA解決方案;
中國聯(lián)通發(fā)布搭載高通Wi-Fi7沉浸式家庭聯(lián)網(wǎng)平臺的Wi-Fi7 BE6500智能路由器VS017;
美格智能推出基于驍龍X35的5G RedCap系列FWA解決方案;
廣翼智聯(lián)推出基于高通QCM4490處理器和高通212S基帶芯片的衛(wèi)星移動手持解決方案;
廣和通發(fā)布基于驍龍460移動平臺的智能模組SC208;
廣翼智聯(lián)發(fā)布基于高通平臺的端側智能計算終端;
美格智能發(fā)布首款搭載高通Aware平臺的智能看護解決方案MC303。
此外,高通與伙伴的碩果不只停留在此,還能支持更多擴展特性,滿足全場景下多元化的業(yè)務需求。
在中興通訊“5G-Advanced聯(lián)合創(chuàng)新及新品發(fā)布會”上,中興通訊攜手中國移動、高通、當紅齊天集團共同啟動了“5G-A XR大空間對戰(zhàn)游戲”規(guī)模落地計劃。此前,在當紅齊天首鋼一高爐·SoReal科幻樂園內,四方聯(lián)合完成業(yè)界首個5G-A室內超密集沉浸式XR業(yè)務保障試點,在近千平米的大空間內同時接入12路XR業(yè)務,平均空口時延低于10ms,實現(xiàn)了無線大空間多人XR免背包游戲體驗。
說到底,連接是智能萬物是技術引擎,也是新質生產力的經(jīng)濟引擎。對高通來說,繼續(xù)推動智能計算無處不在,支持生態(tài)系統(tǒng)跨多品類終端開發(fā)并落地生成式AI新用例、新體驗和新產品,包括下一代AI智能手機、AI PC、XR終端、汽車和機器人等,也是新時代下的長期使命。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。
關注科技創(chuàng)新、技術投資。
以文會友,左手硬核科技,右手浪漫主義。