作者:高通技術公司公共關系副總裁Clare Conley
曾幾何時,科幻電影《回到未來》中用香蕉皮和啤酒做燃料的DeLorean跑車還顯得滑稽可笑,而如今卻已經(jīng)有10%的汽車由電力驅(qū)動 。僅僅一年前,用真正的自然語言與計算機交流尚屬科幻,但現(xiàn)在我們已經(jīng)認識到,個人AI助手將成為下一代人生活中不可或缺的組成部分。
生成式AI在幾乎每個行業(yè)都是無可爭議的變革性技術,明年人們將繼續(xù)感受到它帶來的影響。
我熱愛在高通工作的一個原因是,我的身邊都是發(fā)明家和商業(yè)領袖,他們正在開發(fā)部署領先的邊緣AI、高性能低功耗計算、以及連接技術,旨在隨時隨地支持智能計算。
當然,沒人能夠完全預測明年生成式AI等技術趨勢究竟將如何發(fā)展。但在2023年即將結(jié)束之際,我很高興能與大家分享高通公司高管對于2024年關鍵技術趨勢的思考。
1. AI PC將驅(qū)動筆記本電腦換機“超級周期”
隨著面向PC的AI技術不斷演進,在筆記本電腦換機“超級周期”助力下,2024年PC市場將經(jīng)歷變革性轉(zhuǎn)變。
摩根士丹利預測市場將出現(xiàn)劇變,2024年將有40%的筆記本電腦需要更換,這一數(shù)據(jù)在2025年預計將上升到65%。
高通技術公司高級副總裁兼計算與游戲業(yè)務總經(jīng)理Kedar Kondap表示:“我們預計從2024年開始,PC將迎來決定市場走向的‘超級周期’,筆記本電腦的換新需求和AI的進步將推動PC進入全新時代。
“這一創(chuàng)新不僅是PC市場的演進,更是將在新的一年推動AI PC需求發(fā)展,并重塑企業(yè)和消費者計算體驗的革命。”
只要通過微軟目前的動態(tài),我們就會發(fā)現(xiàn)智能PC和AI助手(如Copilot)即將到來。
在今年十月的驍龍峰會上,高通邀請微軟、惠普、聯(lián)想和戴爾等企業(yè)一同參會,并公布了我們將如何利用專為處理AI任務打造的驍龍X Elite賦能AI PC。
2. 生成式AI將從云端轉(zhuǎn)向個人終端
在2023年,生成式AI的討論主要圍繞云端展開,然而隱私、時延和成本等挑戰(zhàn)日益嚴峻,只有終端側(cè)AI能力才能幫助解決。
高通技術公司高級副總裁兼技術、規(guī)劃和邊緣解決方案業(yè)務總經(jīng)理馬德嘉(Durga Malladi)表示:
“隨著生成式AI日益融入人們的生活,智能手機、PC、汽車甚至物聯(lián)網(wǎng)設備等個人終端將成為多模態(tài)生成式AI模型的中樞。”
在終端側(cè)運行豐富AI任務不僅合理,還能拓寬消費者和企業(yè)獲取這些強大功能的途徑。
馬德嘉補充道:“這種轉(zhuǎn)變將為消費者和企業(yè)開啟關注隱私和個性化的全新水平AI體驗,并為開發(fā)者降低云成本。隨著多模態(tài)生成式AI大模型能夠在終端側(cè)運行,從云端向混合AI或終端側(cè)AI的轉(zhuǎn)變勢不可擋。”
3. 智能手機將更加不可或缺
隨著智能手機引入生成式AI功能,個人AI助手將在用戶的日常生活中不斷學習,從而提供定制化體驗,進化為用戶不可或缺的伙伴。
高通技術公司高級副總裁兼手機業(yè)務總經(jīng)理Chris Patrick表示:“智能手機作為用戶最為個性化的終端,在利用多模態(tài)生成式AI模型,并結(jié)合終端側(cè)傳感器數(shù)據(jù)方面獨具優(yōu)勢。
“用戶的終端側(cè)AI助手將從提供一般性回答,演進為提供有用信息的個性化結(jié)果。”
采用大語言模型(LLM)和視覺模型的應用將利用健康、位置和超本地化信息等傳感器數(shù)據(jù)提供有意義的個性化內(nèi)容。
Patrick補充道:“通過使用不同模態(tài),AI助手將賦能自然交互,能夠完全在終端側(cè)處理并生成文本、語音、圖像甚至視頻。這將把全新用戶體驗引入主流市場,同時解決云端AI成本攀升問題。”
同樣在驍龍峰會上,高通還展示了全新第三代驍龍8支持的能夠滿足這一市場需求的終端側(cè)個性化體驗。
4. 創(chuàng)意工作者將如虎添翼
在創(chuàng)意和營銷流程中更深度地融合AI勢在必行。
高通公司首席營銷官莫珂東(Don McGuire)表示:“生成式AI正在改變?nèi)藗儗W習、娛樂和工作的方式。高通不僅是賦能實現(xiàn)該技術的領軍企業(yè)之一,作為CMO,我也致力于在整個市場營銷部門中部署相關工具。
“作為結(jié)果,我們看到在生產(chǎn)力水平、產(chǎn)品上市時間和效率等方面都有提升,團隊可以將更多時間投入戰(zhàn)略制定和創(chuàng)意協(xié)作,減少耗時的重復性工作。
“AI不是要取代人,而是要擴展和增強人的能力。”
通過訪問大量數(shù)據(jù),生成式AI能夠給出建議并提供有價值的洞察。這將賦能營銷人員更有效地針對特定受眾,讓我們能夠在不同媒介上打造高度個性化的內(nèi)容。
5. 消費者將推動開放式多終端生態(tài)系統(tǒng)發(fā)展
開放式生態(tài)系統(tǒng)的應用將賦能消費者從各種品牌中自由選擇符合其特定需求的最佳終端。
品牌能夠公平參與競爭,努力打造卓越的產(chǎn)品并在市場中脫穎而出,這將增加產(chǎn)品的互操作性,驅(qū)動創(chuàng)新并增強消費者體驗。
高通技術公司高級副總裁兼手機、計算和XR業(yè)務總經(jīng)理阿力克斯·卡圖贊(Alex Katouzian)表示:
“消費者需要增強的跨終端通信和功能,這將成為終端制造商開放生態(tài)系統(tǒng)的推動力量。
“最近蘋果公司宣布支持富通信服務(RCS)標準,以及Link to Windows和Snapdragon Seamless體驗等技術的日益普及,正在不斷推動跨品牌和平臺的互操作性發(fā)展。面向開放生態(tài)系統(tǒng)的轉(zhuǎn)變將為消費者提供更多選擇,使他們能夠選擇符合其特定需求的最佳終端。”
6. 混合現(xiàn)實(MR)將重新定義世界
2024年,過去僅面向發(fā)燒友的混合現(xiàn)實(MR)、虛擬現(xiàn)實(VR)和增強現(xiàn)實(XR)技術將集成到消費產(chǎn)品中,進入主流市場。
高通技術公司副總裁兼XR業(yè)務總經(jīng)理司宏國表示:
“得益于MR功能的廣泛應用、終端的進一步縮小和空間計算的進步,XR正進入快速發(fā)展階段。”
未來還會有更多像Meta Quest 3和Ray Ban Meta這樣經(jīng)濟實惠的硬件產(chǎn)品選擇。
在改善和規(guī)?;瘮U展XR體驗、通過全新工具普及3D內(nèi)容生成、以及創(chuàng)建更逼真更吸引人的虛擬環(huán)境方面,生成式AI將發(fā)揮至關重要的作用。
生成式AI賦能的語音交互界面將提供自然且直觀的XR終端交互方式,其賦能的個人助手和逼真3D虛擬化身也將在XR領域不斷普及。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結(jié)構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結(jié)合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。