科技行者 1月7日 北京消息(文/于藝婉): 十幾天前華為智能計算大會上傳遞出來的一則信息,在今天擲地有聲。1月7日,華為將他們在智能計算領(lǐng)域的雄心轉(zhuǎn)變?yōu)楝F(xiàn)實。繼面向智能終端的麒麟處理器和面向人工智能的昇騰處理器之后,華為宣布推出面向智能計算的業(yè)界最高性能ARM-based處理器-鯤鵬920(Kunpeng 920),并同步推出基于鯤鵬920的TaiShan系列服務(wù)器產(chǎn)品。
華為董事、戰(zhàn)略Marketing總裁徐文偉在開場時就表示,未來世界是一個智能世界,智能世界特征是萬物感知、萬物互聯(lián)、萬物智能。未來信息量巨大,計算無處不在,計算應(yīng)用的場景多種多樣,而場景的多樣性會帶來數(shù)據(jù)的多樣性,進而帶來異構(gòu)計算的需求。“華為本次發(fā)布鯤鵬920及TaiShan服務(wù)器,主要應(yīng)用于大數(shù)據(jù)、分布式存儲、ARM原生應(yīng)用等場景。華為將攜手全球合作伙伴,秉承開放、合作、共贏,促進ARM生態(tài)發(fā)展,做大計算領(lǐng)域空間,擁抱多樣性計算時代!”
鯤鵬920到底為何方神圣?基于ARM架構(gòu)授權(quán),華為自研了ARM核,針對數(shù)據(jù)中心大數(shù)據(jù)、分布式存儲、ARM原生應(yīng)用等場景,通過優(yōu)化分支預測算法、提升運算單元數(shù)量、改進內(nèi)存子系統(tǒng)架構(gòu)等一系列微架構(gòu)設(shè)計,大幅提高了處理器核性能。SPECint Benchmark提供的評分顯示,采用7nm制造工藝的鯤鵬920在典型主頻下得分超過930,將性能紀錄提升了25%。同時,能效比優(yōu)于業(yè)界標桿30%。鯤鵬920以更低功耗為數(shù)據(jù)中心提供了更強性能。
為了改善在低延時條件下高并發(fā)的能力, 華為在鯤鵬920上采用三項措施:首先,將業(yè)界DDR通道數(shù)量從6通道增加到8通道,速率從2667MHz提升至2933MHz, 總帶寬達到1.5T比特每秒,帶寬提升46%;其次,將PCIe從3.0升級到4.0,速率翻番,帶寬達到640Gbps, 比業(yè)界主流提升66%;第三,將網(wǎng)口帶寬從25G直接提升到100G,帶寬翻了4倍。
鯤鵬920不僅是一顆通用CPU,還同時集成了南橋、網(wǎng)卡、SAS存儲控制器等三種芯片,做到集成度業(yè)界第一,單顆芯片實現(xiàn)4顆芯片的功能。同時,還可以釋放出更多槽位擴展更多功能,大幅提高系統(tǒng)的集成度,也給客戶的TCO帶來收益。
再來看看基于鯤鵬920的TaiShan系列服務(wù)器產(chǎn)品。均衡型、存儲型和高密型三款機型的TaiShan系列服務(wù)器主要面向大數(shù)據(jù)、分布式存儲和ARM原生應(yīng)用等場景,可以發(fā)揮ARM架構(gòu)在多核、高能效等方面的優(yōu)勢,為企業(yè)構(gòu)建高性能、低功耗的新計算平臺。以大數(shù)據(jù)場景為例,可實現(xiàn)多核高并發(fā)和資源調(diào)度調(diào)優(yōu),計算性能提升20%。
基于TaiShan服務(wù)器,華為云也將提供彈性云服務(wù)、裸金屬服務(wù)和云手機服務(wù)。云游戲就是云手機服務(wù)的一種應(yīng)用,以Gb為單位的游戲不用再占用手機內(nèi)存,也不用再對手機的其它硬件配置提出嚴苛要求,只需一個只有幾Mb的APP作為入口登陸云端,即可隨時隨地進入游戲世界。這不僅緩解了消費者對硬件的絕對依賴,同時也為游戲公司提升用戶體驗拓展了新型模式。
云計算的興起,使得數(shù)據(jù)中心規(guī)模越來越大,從幾臺服務(wù)器、幾個機架演變成以萬臺服務(wù)器為單位的數(shù)據(jù)中心集群。占地空間和能源消耗成為大型數(shù)據(jù)中心的重要影響因素,基于ARM架構(gòu)的鯤鵬920及TaiShan服務(wù)器的節(jié)能表現(xiàn)將更具實際意義。據(jù)華為介紹,在大規(guī)模數(shù)據(jù)中心業(yè)務(wù)實踐中,每萬臺服務(wù)器可以每年省電1千萬度,碳排放每年減少10,000噸。
低功耗是ARM能夠在智能終端領(lǐng)域叱咤風云的看家本事,而計算及高性能服務(wù)器領(lǐng)域從來都是X86架構(gòu)的天下,華為在此刻推出基于ARM架構(gòu)的處理器和服務(wù)器產(chǎn)品,會不會走入一條死胡同?
對此,徐文偉給出了明確的答復。“沒有一個單一的計算架構(gòu)能夠滿足所有場景、所有數(shù)據(jù)類型的處理,各種CPU、DSP、GPU、AI芯片、FPGA等會同時存在,多種計算架構(gòu)共存的異構(gòu)計算,是未來的發(fā)展之路。隨著ARM技術(shù)不斷進步,多核性能大幅提高,尤其是開放的生態(tài),ARM也從端和邊緣計算走向服務(wù)器和數(shù)據(jù)中心。當下,ARM架構(gòu)在面向大數(shù)據(jù)、分布式存儲和ARM原生應(yīng)用等場景,不僅可以為企業(yè)構(gòu)建高性能、低功耗的新計算平臺,也是計算發(fā)展的必然趨勢。”
華為GIV2025預測,到2025年新增數(shù)據(jù)量180ZB,是2018年新增數(shù)據(jù)量的18倍,面對如此巨大的數(shù)據(jù)增長,對計算和存儲都提出了很高的要求。算力供應(yīng)問題,存在嚴重的供需不平衡。而華為認為在大數(shù)據(jù)、分布式存儲和ARM原生應(yīng)用等特定場景下,“ARM處理能力不行”的這頂帽子可以甩掉了。
雖然華為在力推鯤鵬920的TaiShan系列服務(wù)器,但是他們在發(fā)布產(chǎn)品期間更多地談到了和英特爾之間的合作。徐文偉表示:“鯤鵬920不是要與Intel的CPU競爭,更不是替代。不同的產(chǎn)品在不同的領(lǐng)域發(fā)揮所長。面向未來18倍海量數(shù)據(jù)的增長,以及每年10倍算力的遞增,帶來了大量異構(gòu)計算的需求。長期以來,華為和Intel一起合作取得了很好的成績,為ICT產(chǎn)業(yè)發(fā)展做出積極貢獻,華為和Intel也將長期保持戰(zhàn)略合作,聚焦價值持續(xù)創(chuàng)新。”
同時,華為也一再強調(diào),他們從未想過成為一家芯片公司,走自研芯片這條路的初衷是降低成本、提高產(chǎn)品性能并以開放的姿態(tài)致力于產(chǎn)業(yè)各界的合作創(chuàng)新。“麒麟980助力華為手機推向智慧新高度,基于昇騰310的產(chǎn)品和服務(wù)(如華為云)使能行業(yè)普惠AI;今天,華為以鯤鵬920,把計算帶入多核異構(gòu)的多樣性時代。今天,ARM產(chǎn)業(yè)迎來新的發(fā)展機會,華為期待,產(chǎn)業(yè)伙伴緊密合作共同開創(chuàng)一個多樣性的計算時代。”徐文偉說。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠?qū)碗s指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學領(lǐng)域帶來了效率和精度的雙重突破。