生成式AI的創(chuàng)新和發(fā)展速度前所未有,而這僅僅是一個(gè)開始。人們使用這項(xiàng)技術(shù)的方式、場(chǎng)景和原因?qū)?huì)非常廣泛,甚至超乎想象。初步估計(jì)顯示,生成式AI市場(chǎng)規(guī)模將達(dá)到1萬億美元。
生成式AI不僅有望改變?nèi)藗兯阉骱蛣?chuàng)作內(nèi)容的方式,還能夠改善日常生活。借助生成式AI,智能手機(jī)能夠成為真正的數(shù)字助手,讓用戶自然地溝通交流,并獲得貼切的回答。PC用戶可以利用這項(xiàng)技術(shù)閱讀或撰寫電子郵件、起草文檔和自動(dòng)創(chuàng)建演示文稿。在駕乘汽車時(shí),對(duì)話式車內(nèi)助手可以對(duì)汽車充電、購買停車券或在回家途中預(yù)訂晚餐提供建議。商店的AI服務(wù)臺(tái)和智能購物車能夠根據(jù)每周特惠、預(yù)算金額和家庭偏好,幫助消費(fèi)者擬定食譜。
為了釋放這項(xiàng)技術(shù)的全部潛能并滿足日益增長的需求,生成式AI既需要云,也需要數(shù)十億能夠以低功耗進(jìn)行高性能AI計(jì)算的網(wǎng)聯(lián)終端,如智能手機(jī)、PC和汽車。這就是混合AI?;旌螦I計(jì)算架構(gòu)在云端和終端進(jìn)行分布式處理,能夠優(yōu)化效率并提升整體用戶體驗(yàn)。
生成式AI處理可以直接在終端側(cè)運(yùn)行,也可以按需發(fā)送到云端,或者將兩者相結(jié)合——無論采取何種方式,對(duì)用戶而言都是無縫實(shí)現(xiàn)的。
用戶期望擁有與傳統(tǒng)搜索類似的體驗(yàn),那就是能夠瞬間顯示搜索結(jié)果。要滿足這樣的期望,還要保證服務(wù)質(zhì)量,僅利用云端處理的成本太高,尤其是在需求高峰期,因此難以實(shí)現(xiàn)規(guī)?;?。
數(shù)據(jù)中心能耗高且價(jià)格昂貴。據(jù)估計(jì),每一次基于生成式AI的網(wǎng)絡(luò)搜索查詢(query),其成本是傳統(tǒng)搜索的10倍。以每天超過100億次查詢計(jì)算,每年的增量成本可能達(dá)到數(shù)十億美元。網(wǎng)絡(luò)搜索只是生成式AI變革多個(gè)行業(yè)的眾多方式之一。
除成本外,在云端進(jìn)行全部推理處理還面臨隱私、可靠性和性能方面的挑戰(zhàn)。當(dāng)請(qǐng)求進(jìn)入云端、數(shù)據(jù)離開終端時(shí),就會(huì)產(chǎn)生潛在的安全問題。事實(shí)上,由于收集和存儲(chǔ)個(gè)人數(shù)據(jù)等監(jiān)管和合規(guī)問題導(dǎo)致模型被禁用或暫時(shí)禁用的情況已經(jīng)出現(xiàn)。
混合AI勢(shì)不可擋。隨著人們不斷探尋使用生成式AI的新方式,對(duì)云基礎(chǔ)設(shè)施的需求將激增。混合AI處理將是計(jì)算的下一次轉(zhuǎn)型,正如我們所看到的從大型主機(jī)演進(jìn)到臺(tái)式機(jī),再到今天云和我們手中的終端相結(jié)合的模式一樣。
利用高性能、低功耗終端的處理能力,將能夠高效推動(dòng)生成式AI的規(guī)模化擴(kuò)展。云端和終端將協(xié)同工作,通過強(qiáng)大、高效且高度優(yōu)化的AI功能,打造下一代用戶體驗(yàn)。
本文原載于Fortune.com:https://fortune.com/2023/05/15/qualcomm-ceo-ai-is-going-to-touch-every-corner-of-our-lives-devices-tech-cristiano-amon/
好文章,需要你的鼓勵(lì)
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對(duì)弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。