近期,AMD在紐約舉辦的分析師大會(Financial Analyst Day)上展示了很多新產(chǎn)品與新技術(shù),其中,HBM晶片堆棧式高帶寬內(nèi)存吸引了很多人的目光,AMD總裁兼首席執(zhí)行官蘇姿豐博士表示,HBM是真正能夠以更高的帶寬、更低的功耗來提供很好的效能。
HBM有何優(yōu)勢?它會何時(shí)推出呢?帶著這些問題,我們采訪了AMD事業(yè)群首席技術(shù)官(Business Unit CTO) Joe Macri,他表示,HBM在整個功耗降低方面做的非常好,它把所有節(jié)省的功耗用于補(bǔ)償GPU核心的功耗;另外,數(shù)據(jù)傳輸?shù)膸挻蠹s是每秒100GB。
圖為AMD事業(yè)群首席技術(shù)官(Business Unit CTO) Joe Macri
AMD開發(fā)HBM已經(jīng)有7年的歷史了,是什么原因使得AMD對HBM產(chǎn)生了這么大的興趣?Joe Macri表示,如今很多系統(tǒng)的問題是功耗較大,很多高端顯卡的功耗在250w-300w之間。有時(shí)會碰到一種極限,當(dāng)GPU性能已經(jīng)很高時(shí),功耗也非常高,內(nèi)存的功耗也變得非常高,那是一個非??膳碌氖虑?,會造成整個系統(tǒng)熱量非常大,功耗很高,但是性能提升卻有限。很多時(shí)候?yàn)榱吮3窒到y(tǒng)功耗的平衡,內(nèi)存功耗很高的話,GPU的功耗就不可以很高,這樣會直接影響到GPU的性能。而AMD就想要生產(chǎn)出高帶寬、低功耗的內(nèi)存,這樣就可以平衡整個系統(tǒng)的性能和功耗。
如上圖所示,垂直的“四條線”是比較有功能性的DRAM的堆棧,這也是HBM整個內(nèi)存的晶片構(gòu)造,出自SK Hynix。左邊藍(lán)色的是整套SK Hynix內(nèi)存的HBM晶片,右邊是AMD GPU的晶片。Joe Macri表示,通過1024位連線進(jìn)行聯(lián)系,有非常高速的硅晶片的銅聯(lián)線來進(jìn)行數(shù)據(jù)交互,數(shù)據(jù)非常大且速度非???,這是不能通過主板來解決的,必須通過這種聯(lián)線來做到,另外,HBM能夠與CPU/GPU封裝在一起。
HBM真正實(shí)現(xiàn)了低功耗和高帶寬,它的外形很小,并且可以把更多的功耗轉(zhuǎn)移到GPU,而且很多用途可以并到HBM,除了獨(dú)立顯卡和游戲以外,像HPC超級計(jì)算機(jī)、高性能計(jì)算、電信、服務(wù)器、還有所有類型的PC都會從中受益。
我們所熟悉的DDR5與HBM相比有很大的區(qū)別,就是帶寬上很不一樣,DDR5是32位,HBM則是1024位。Joe Macri解釋道,最重要的是它的時(shí)鐘頻率,DDR5是1750兆赫茲,每秒7GB的數(shù)據(jù)傳輸量;HBM的整個速度降低得非??欤罡卟诺?00兆赫茲,1GB數(shù)據(jù)傳輸量,速率的降低大量地節(jié)省了功耗,這是最重要的一點(diǎn)。而整個數(shù)據(jù)傳輸?shù)膸?,DDR5是28GB每秒每個芯片,HBM大約是每秒100GB,它的功耗也大大降低了,但是由于整個位寬比較高,所以整個數(shù)據(jù)傳輸?shù)膸捠欠浅8叩?,大概是過去的5倍。
Joe Macri表示,AMD在建立一個HBM的完整的生態(tài)系統(tǒng),主要包括DRAM、組裝和封裝、芯片測試。AMD是第一家開始做HBM的公司,不過隨后一定也會有其他公司陸續(xù)加入。
好文章,需要你的鼓勵
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運(yùn)動質(zhì)量,在多項(xiàng)測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。