最近AI芯片領(lǐng)域的新聞層出不窮,借助今天文章為大家做一番簡(jiǎn)單的整理。篇幅有限,內(nèi)容可能較為簡(jiǎn)短,后續(xù)也將在其他文章中做進(jìn)一步補(bǔ)充。
先從幾條大新聞開(kāi)始。Amazon AWS于12月1日的年度AWS re: Invent大會(huì)上發(fā)布了兩項(xiàng)重要的AI聲明。首先,AWS掌門(mén)人Andy Jassy宣布將在其彈性云體系中提供英特爾的Gaudi訓(xùn)練芯片。AWS的實(shí)際部署,也讓我們第一次對(duì)Gaudi給予確切關(guān)注。對(duì)于英特爾來(lái)說(shuō),在去年投入20億美元收購(gòu)Habana Labs并由此拿下Gaudi項(xiàng)目之后,這也代表著一個(gè)期待已久的好消息。
圖一:Amazon AWS的全面部署,堪稱(chēng)Habana Gaudi訓(xùn)練芯片設(shè)計(jì)成果的首次公開(kāi)亮相。
第二點(diǎn),也是更令人驚訝的一點(diǎn):Jassy宣布AWS將在2021年下半年推出其內(nèi)部開(kāi)發(fā)的訓(xùn)練專(zhuān)用芯片,即“Trainium”。AWS宣稱(chēng)Trainium將成為云端速度最快的AI芯片。對(duì)Trainium、Gaudi以及英偉達(dá)GPU的全面支持,也代表著AWS繼續(xù)踐行其為客戶(hù)提供多種技術(shù)選項(xiàng)以滿(mǎn)足特定需求的長(zhǎng)期發(fā)展策略。從定位上看,Trainium似乎將成為Inferentia的完美搭檔——后者由AWS于去年發(fā)布,而且已經(jīng)成為實(shí)際部署的專(zhuān)用推理芯片。
圖二:AWS宣布將部署AI專(zhuān)用型Trainium訓(xùn)練芯片。
高通公司在12月1日召開(kāi)的年度驍龍峰會(huì)上發(fā)布了最新一代驍龍?zhí)幚砥?,即驍?88。新款移動(dòng)芯片采用高通的第六代AI引擎,此引擎已經(jīng)成為AI融合處理單元,在Int-8性能方面可達(dá)到26 TOPS。這套引擎還簡(jiǎn)化了此前的三域設(shè)備,可支持標(biāo)量、張量與矢量運(yùn)算。此外,該引擎還將片上內(nèi)存提升達(dá)16倍,用以處理體量更大的模型。
接下來(lái),讓我們把目光投向初創(chuàng)企業(yè)。
• SimpleMachines公布用于低功耗推理的芯片。根據(jù)目前的規(guī)格數(shù)字來(lái)看,這家初創(chuàng)企業(yè)的芯片似乎頗具吸引力:僅需4瓦功率即可實(shí)現(xiàn)35 TOPS(8-bit)。該公司稱(chēng)這款芯片的核心優(yōu)勢(shì)在于其“可組合行為執(zhí)行”技術(shù),意味著芯片能夠操縱并理解程序?qū)傩裕ɡ鐢?shù)據(jù)大小與程序大?。┎?jù)此進(jìn)行存儲(chǔ)與執(zhí)行優(yōu)化。
• Mythic是一家位于得克薩斯州奧斯汀市的初創(chuàng)公司,其采用模擬處理路線(xiàn)進(jìn)行推理。該公司最近宣布開(kāi)始向部分選定客戶(hù)提供芯片樣品。Mythic宣稱(chēng)其計(jì)算密度可達(dá)數(shù)字式同類(lèi)產(chǎn)品(我們姑且認(rèn)為這里指的是T4芯片)的50倍,而成本僅為二十分之一。Mythic Analog Compute Engine則用于解決4-bit與8-bit推理作業(yè)的嵌入式及邊緣推理應(yīng)用。我們將持續(xù)關(guān)注相關(guān)消息,并為大家及時(shí)帶來(lái)最新報(bào)道。
• Imagination是一家位于英國(guó)的中國(guó)企業(yè),專(zhuān)門(mén)提供手機(jī)GPU及其他IP方案。該公司剛剛公布了其AI Series 4多核心NNA芯片IP。根據(jù)發(fā)言人的表述,其目標(biāo)主要針對(duì)汽車(chē)智能這一尚未被科技巨頭明確占領(lǐng)的市場(chǎng)。SoC設(shè)計(jì)人員可以獲取許可,并將這套極為強(qiáng)大的高可擴(kuò)展IP方案嵌入自家芯片。據(jù)我所知,其每瓦性能可達(dá)到30 TOPS,這也使其成為當(dāng)前單位功率性能最高的DNN處理器。期待這一令人振奮的項(xiàng)目能夠發(fā)布更多后續(xù)消息。
總結(jié)
AI領(lǐng)域的“寒武紀(jì)生物大爆炸”終于來(lái)臨,知名芯片廠(chǎng)商、云服務(wù)供應(yīng)商以及初創(chuàng)企業(yè)的新款芯片正全力沖擊推理與訓(xùn)練等目標(biāo)。但這還只是第二輪比拼,希望明年會(huì)發(fā)布更多相關(guān)消息。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在A(yíng)udioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀(guān)和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線(xiàn)性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話(huà)問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀(guān)對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。