作者:高通技術(shù)公司公共關(guān)系副總裁Clare Conley
曾幾何時(shí),科幻電影《回到未來(lái)》中用香蕉皮和啤酒做燃料的DeLorean跑車還顯得滑稽可笑,而如今卻已經(jīng)有10%的汽車由電力驅(qū)動(dòng) 。僅僅一年前,用真正的自然語(yǔ)言與計(jì)算機(jī)交流尚屬科幻,但現(xiàn)在我們已經(jīng)認(rèn)識(shí)到,個(gè)人AI助手將成為下一代人生活中不可或缺的組成部分。
生成式AI在幾乎每個(gè)行業(yè)都是無(wú)可爭(zhēng)議的變革性技術(shù),明年人們將繼續(xù)感受到它帶來(lái)的影響。
我熱愛在高通工作的一個(gè)原因是,我的身邊都是發(fā)明家和商業(yè)領(lǐng)袖,他們正在開發(fā)部署領(lǐng)先的邊緣AI、高性能低功耗計(jì)算、以及連接技術(shù),旨在隨時(shí)隨地支持智能計(jì)算。
當(dāng)然,沒人能夠完全預(yù)測(cè)明年生成式AI等技術(shù)趨勢(shì)究竟將如何發(fā)展。但在2023年即將結(jié)束之際,我很高興能與大家分享高通公司高管對(duì)于2024年關(guān)鍵技術(shù)趨勢(shì)的思考。
1. AI PC將驅(qū)動(dòng)筆記本電腦換機(jī)“超級(jí)周期”
隨著面向PC的AI技術(shù)不斷演進(jìn),在筆記本電腦換機(jī)“超級(jí)周期”助力下,2024年P(guān)C市場(chǎng)將經(jīng)歷變革性轉(zhuǎn)變。
摩根士丹利預(yù)測(cè)市場(chǎng)將出現(xiàn)劇變,2024年將有40%的筆記本電腦需要更換,這一數(shù)據(jù)在2025年預(yù)計(jì)將上升到65%。
高通技術(shù)公司高級(jí)副總裁兼計(jì)算與游戲業(yè)務(wù)總經(jīng)理Kedar Kondap表示:“我們預(yù)計(jì)從2024年開始,PC將迎來(lái)決定市場(chǎng)走向的‘超級(jí)周期’,筆記本電腦的換新需求和AI的進(jìn)步將推動(dòng)PC進(jìn)入全新時(shí)代。
“這一創(chuàng)新不僅是PC市場(chǎng)的演進(jìn),更是將在新的一年推動(dòng)AI PC需求發(fā)展,并重塑企業(yè)和消費(fèi)者計(jì)算體驗(yàn)的革命。”
只要通過(guò)微軟目前的動(dòng)態(tài),我們就會(huì)發(fā)現(xiàn)智能PC和AI助手(如Copilot)即將到來(lái)。
在今年十月的驍龍峰會(huì)上,高通邀請(qǐng)微軟、惠普、聯(lián)想和戴爾等企業(yè)一同參會(huì),并公布了我們將如何利用專為處理AI任務(wù)打造的驍龍X Elite賦能AI PC。
2. 生成式AI將從云端轉(zhuǎn)向個(gè)人終端
在2023年,生成式AI的討論主要圍繞云端展開,然而隱私、時(shí)延和成本等挑戰(zhàn)日益嚴(yán)峻,只有終端側(cè)AI能力才能幫助解決。
高通技術(shù)公司高級(jí)副總裁兼技術(shù)、規(guī)劃和邊緣解決方案業(yè)務(wù)總經(jīng)理馬德嘉(Durga Malladi)表示:
“隨著生成式AI日益融入人們的生活,智能手機(jī)、PC、汽車甚至物聯(lián)網(wǎng)設(shè)備等個(gè)人終端將成為多模態(tài)生成式AI模型的中樞。”
在終端側(cè)運(yùn)行豐富AI任務(wù)不僅合理,還能拓寬消費(fèi)者和企業(yè)獲取這些強(qiáng)大功能的途徑。
馬德嘉補(bǔ)充道:“這種轉(zhuǎn)變將為消費(fèi)者和企業(yè)開啟關(guān)注隱私和個(gè)性化的全新水平AI體驗(yàn),并為開發(fā)者降低云成本。隨著多模態(tài)生成式AI大模型能夠在終端側(cè)運(yùn)行,從云端向混合AI或終端側(cè)AI的轉(zhuǎn)變勢(shì)不可擋。”
3. 智能手機(jī)將更加不可或缺
隨著智能手機(jī)引入生成式AI功能,個(gè)人AI助手將在用戶的日常生活中不斷學(xué)習(xí),從而提供定制化體驗(yàn),進(jìn)化為用戶不可或缺的伙伴。
高通技術(shù)公司高級(jí)副總裁兼手機(jī)業(yè)務(wù)總經(jīng)理Chris Patrick表示:“智能手機(jī)作為用戶最為個(gè)性化的終端,在利用多模態(tài)生成式AI模型,并結(jié)合終端側(cè)傳感器數(shù)據(jù)方面獨(dú)具優(yōu)勢(shì)。
“用戶的終端側(cè)AI助手將從提供一般性回答,演進(jìn)為提供有用信息的個(gè)性化結(jié)果。”
采用大語(yǔ)言模型(LLM)和視覺模型的應(yīng)用將利用健康、位置和超本地化信息等傳感器數(shù)據(jù)提供有意義的個(gè)性化內(nèi)容。
Patrick補(bǔ)充道:“通過(guò)使用不同模態(tài),AI助手將賦能自然交互,能夠完全在終端側(cè)處理并生成文本、語(yǔ)音、圖像甚至視頻。這將把全新用戶體驗(yàn)引入主流市場(chǎng),同時(shí)解決云端AI成本攀升問(wèn)題。”
同樣在驍龍峰會(huì)上,高通還展示了全新第三代驍龍8支持的能夠滿足這一市場(chǎng)需求的終端側(cè)個(gè)性化體驗(yàn)。
4. 創(chuàng)意工作者將如虎添翼
在創(chuàng)意和營(yíng)銷流程中更深度地融合AI勢(shì)在必行。
高通公司首席營(yíng)銷官莫珂東(Don McGuire)表示:“生成式AI正在改變?nèi)藗儗W(xué)習(xí)、娛樂(lè)和工作的方式。高通不僅是賦能實(shí)現(xiàn)該技術(shù)的領(lǐng)軍企業(yè)之一,作為CMO,我也致力于在整個(gè)市場(chǎng)營(yíng)銷部門中部署相關(guān)工具。
“作為結(jié)果,我們看到在生產(chǎn)力水平、產(chǎn)品上市時(shí)間和效率等方面都有提升,團(tuán)隊(duì)可以將更多時(shí)間投入戰(zhàn)略制定和創(chuàng)意協(xié)作,減少耗時(shí)的重復(fù)性工作。
“AI不是要取代人,而是要擴(kuò)展和增強(qiáng)人的能力。”
通過(guò)訪問(wèn)大量數(shù)據(jù),生成式AI能夠給出建議并提供有價(jià)值的洞察。這將賦能營(yíng)銷人員更有效地針對(duì)特定受眾,讓我們能夠在不同媒介上打造高度個(gè)性化的內(nèi)容。
5. 消費(fèi)者將推動(dòng)開放式多終端生態(tài)系統(tǒng)發(fā)展
開放式生態(tài)系統(tǒng)的應(yīng)用將賦能消費(fèi)者從各種品牌中自由選擇符合其特定需求的最佳終端。
品牌能夠公平參與競(jìng)爭(zhēng),努力打造卓越的產(chǎn)品并在市場(chǎng)中脫穎而出,這將增加產(chǎn)品的互操作性,驅(qū)動(dòng)創(chuàng)新并增強(qiáng)消費(fèi)者體驗(yàn)。
高通技術(shù)公司高級(jí)副總裁兼手機(jī)、計(jì)算和XR業(yè)務(wù)總經(jīng)理阿力克斯·卡圖贊(Alex Katouzian)表示:
“消費(fèi)者需要增強(qiáng)的跨終端通信和功能,這將成為終端制造商開放生態(tài)系統(tǒng)的推動(dòng)力量。
“最近蘋果公司宣布支持富通信服務(wù)(RCS)標(biāo)準(zhǔn),以及Link to Windows和Snapdragon Seamless體驗(yàn)等技術(shù)的日益普及,正在不斷推動(dòng)跨品牌和平臺(tái)的互操作性發(fā)展。面向開放生態(tài)系統(tǒng)的轉(zhuǎn)變將為消費(fèi)者提供更多選擇,使他們能夠選擇符合其特定需求的最佳終端。”
6. 混合現(xiàn)實(shí)(MR)將重新定義世界
2024年,過(guò)去僅面向發(fā)燒友的混合現(xiàn)實(shí)(MR)、虛擬現(xiàn)實(shí)(VR)和增強(qiáng)現(xiàn)實(shí)(XR)技術(shù)將集成到消費(fèi)產(chǎn)品中,進(jìn)入主流市場(chǎng)。
高通技術(shù)公司副總裁兼XR業(yè)務(wù)總經(jīng)理司宏國(guó)表示:
“得益于MR功能的廣泛應(yīng)用、終端的進(jìn)一步縮小和空間計(jì)算的進(jìn)步,XR正進(jìn)入快速發(fā)展階段。”
未來(lái)還會(huì)有更多像Meta Quest 3和Ray Ban Meta這樣經(jīng)濟(jì)實(shí)惠的硬件產(chǎn)品選擇。
在改善和規(guī)?;瘮U(kuò)展XR體驗(yàn)、通過(guò)全新工具普及3D內(nèi)容生成、以及創(chuàng)建更逼真更吸引人的虛擬環(huán)境方面,生成式AI將發(fā)揮至關(guān)重要的作用。
生成式AI賦能的語(yǔ)音交互界面將提供自然且直觀的XR終端交互方式,其賦能的個(gè)人助手和逼真3D虛擬化身也將在XR領(lǐng)域不斷普及。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。