av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃,關(guān)注公眾號

  • 科技行者

  • 算力行者

見證連接與計算的「力量」

首頁 “GPU閑置過半,器件逼近物理極限”?是德科技如何應(yīng)對AI基礎(chǔ)設(shè)施之困

“GPU閑置過半,器件逼近物理極限”?是德科技如何應(yīng)對AI基礎(chǔ)設(shè)施之困

2025-07-09 19:48
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-07-09 19:48 ? 周雅

作者 | 周雅

“GPU閑置過半,器件逼近物理極限”?是德科技如何應(yīng)對AI基礎(chǔ)設(shè)施之困

“為什么AI這么火?”

是德科技大中華區(qū)高速數(shù)字市場部經(jīng)理李堅,最近在是德科技(Keysight Technologies)年度技術(shù)會議 Keysight World Tech Day 2025上,拋出這個問題的同時,答案也呼之欲出:就像是90年代的移動通信、2001年前后的互聯(lián)網(wǎng),以及隨后的移動互聯(lián)網(wǎng)浪潮,而AI是未來10年內(nèi)最大的風(fēng)口。

Bloomberg數(shù)據(jù)顯示,全球AI市場規(guī)模預(yù)計將從2022年的869億美元增長至2030年的1.3萬億美元。Markets and Markets數(shù)據(jù)進(jìn)一步指出,該市場在2024至2030年的年復(fù)合增長率預(yù)計高達(dá)35.7%,這一增長,預(yù)期是驅(qū)動全球企業(yè)大規(guī)模投入AI基礎(chǔ)設(shè)施建設(shè)的核心動力。

“GPU閑置過半,器件逼近物理極限”?是德科技如何應(yīng)對AI基礎(chǔ)設(shè)施之困

但是,在AI高速發(fā)展的背后,數(shù)據(jù)中心的實際運營也出現(xiàn)了瓶頸。

數(shù)據(jù)中心的瓶頸

我們知道,數(shù)據(jù)中心的復(fù)雜性超乎想象,它由大量的服務(wù)器、GPU、CPU、網(wǎng)絡(luò)交換機等組件構(gòu)成,這些設(shè)備通過機架連接,機架之間再通過復(fù)雜的網(wǎng)絡(luò)架構(gòu)連接成集群,最終由數(shù)百個集群組成一個完整的數(shù)據(jù)中心。

數(shù)據(jù)中心的復(fù)雜,要求在多個技術(shù)層面取得突破:首先是高速的網(wǎng)絡(luò)技術(shù);其次是計算架構(gòu),包括GPU性能的持續(xù)提升;最后,也是至關(guān)重要的一點——功耗。

“GPU閑置過半,器件逼近物理極限”?是德科技如何應(yīng)對AI基礎(chǔ)設(shè)施之困

圖源:是德科技

正如是德科技高級副總裁兼通信解決方案事業(yè)部總裁Kailash Narayanan現(xiàn)場指出,算力固然重要,但如果能耗過高,技術(shù)的實用性將大打折扣,因此,所有的高速、高性能計算,都必須在極低的功耗下實現(xiàn),這是AI等技術(shù)能否大規(guī)模落地的核心前提。

“GPU閑置過半,器件逼近物理極限”?是德科技如何應(yīng)對AI基礎(chǔ)設(shè)施之困

是德科技高級副總裁兼通信解決方案事業(yè)部總裁Kailash Narayanan

在深入分析AI數(shù)據(jù)中心建設(shè)過程時,李堅進(jìn)一步揭示了兩個普遍的痛點:

第一,GPU利用率普遍偏低。

GPU作為AI數(shù)據(jù)中心最核心且最貴的算力資產(chǎn),其工作效率直接決定了數(shù)據(jù)中心的整體效能。然而,是德科技的調(diào)研數(shù)據(jù)顯示,在典型的模型訓(xùn)練過程中,GPU的實際計算時間僅占約20%,另有16%為計算與數(shù)據(jù)傳輸?shù)闹丿B時間,Memory的時間占2%,而高達(dá)62%的時間都處于等待狀態(tài)。這意味著,一個GPU的真正有效工作時間僅為38%左右。

李堅進(jìn)一步指出,造成GPU利用率低的主要原因是“數(shù)據(jù)傳輸瓶頸”——GPU沒有及時收到數(shù)據(jù),自然就無法進(jìn)行計算,導(dǎo)致算力資源的大量浪費。

第二,可靠性差。

大語言模型的訓(xùn)練周期通常長達(dá)數(shù)周甚至數(shù)月。李堅指出,有數(shù)據(jù)顯示,一次訓(xùn)練任務(wù)能夠不受干擾、順利完成的概率僅為57%,因為中途可能出現(xiàn)各種軟硬件故障,而硬件故障是導(dǎo)致訓(xùn)練中斷的主要原因。

問題的根源在于,為滿足AI算力需求,數(shù)據(jù)中心內(nèi)部的元器件在高溫、高速、7x24小時不間斷運行,很多器件已經(jīng)逼近物理極限。“目前很多算力中心的高速器件的可靠性,遠(yuǎn)未達(dá)到傳統(tǒng)數(shù)據(jù)中心的水平。例如,一個NVIDIA NV72機柜內(nèi)包含超過五千根線纜和上百個光模塊,任何一個組件的失效都可能導(dǎo)致整個系統(tǒng)停機,如果缺少有效的斷點保護(hù)與恢復(fù)機制,之前的訓(xùn)練成果可能全部作廢。”李堅進(jìn)一步強調(diào)。

“GPU閑置過半,器件逼近物理極限”?是德科技如何應(yīng)對AI基礎(chǔ)設(shè)施之困

是德科技大中華區(qū)高速數(shù)字市場部經(jīng)理李堅

這兩個瓶頸的產(chǎn)生,與AI的快速演進(jìn)密切相關(guān)。

李堅解釋,大模型需要大算力、大數(shù)據(jù)、大帶寬的支持,這就推動了數(shù)據(jù)中心內(nèi)部互連技術(shù)標(biāo)準(zhǔn)的快速迭代,但現(xiàn)有標(biāo)準(zhǔn)無法滿足頭部算力芯片的帶寬需求。所以,未來幾年里,存儲技術(shù)將快速發(fā)展,從DDR5向DDR6/7、HBM3/4演進(jìn),接口技術(shù)從PCIe 5向PCIe 6/7發(fā)展。

此外,速率的提升也帶來物理挑戰(zhàn)。高速信號在傳統(tǒng)PCB板上傳輸損耗和串?dāng)_嚴(yán)重,迫使新型算力機柜大量使用電纜和光纜。但隨著速率從800G向1.6T、3.2T提升,電纜的有效傳輸距離被急劇壓縮,而有源光電模塊雖能增強傳輸,卻帶來了明顯的功耗和散熱問題,進(jìn)一步威脅到系統(tǒng)穩(wěn)定性。

“GPU閑置過半,器件逼近物理極限”?是德科技如何應(yīng)對AI基礎(chǔ)設(shè)施之困

總之,如何解決這些底層物理問題,是提升AI產(chǎn)業(yè)整體投資回報率的關(guān)鍵。

是德科技的“KAI矩陣”

面對AI基礎(chǔ)設(shè)施的效率和可靠性挑戰(zhàn),是德科技正式推出一個全新的產(chǎn)品矩陣“Keysight AI”(簡稱“KAI”),為AI基礎(chǔ)設(shè)施提供全棧、全生命周期的支持。

“GPU閑置過半,器件逼近物理極限”?是德科技如何應(yīng)對AI基礎(chǔ)設(shè)施之困

KAI被劃分為四大板塊,針對數(shù)據(jù)中心從計算到網(wǎng)絡(luò)傳輸?shù)娜窂剑?/p>

1. KAI Compute(KAI高速計算):聚焦于數(shù)據(jù)中心的最底層——算力板卡。它提供針對GPU、CPU、高速內(nèi)存(HBM)及其互連接口的測試驗證方案,旨在確保最基礎(chǔ)的計算單元穩(wěn)定可靠。

2. KAI Interconnect(KAI互連):聚焦于板卡之間的連接。當(dāng)一塊塊算力板卡被造出來后,需要通過高速的電纜、光模塊、光連接器等組件連接起來,形成計算節(jié)點乃至超級節(jié)點。所以是德科技將旗下的網(wǎng)絡(luò)分析儀、高速誤碼儀、采樣示波器等一系列用于驗證光電互連性能的解決方案,統(tǒng)一歸入KAI Interconnect矩陣,保障數(shù)據(jù)傳輸物理通道的質(zhì)量。

3. KAI Network(KAI網(wǎng)絡(luò)):計算節(jié)點和超級節(jié)點,還需要通過網(wǎng)卡、交換機、路由器等網(wǎng)絡(luò)設(shè)備,組成一個規(guī)模更宏大、結(jié)構(gòu)更復(fù)雜的算力網(wǎng)絡(luò)。在這一層面,測試的需求從物理層延伸到了網(wǎng)絡(luò)層乃至應(yīng)用層。是德科技在多年前耗資16億美元收購的行業(yè)翹楚Ixia,其深厚的技術(shù)積累構(gòu)成了KAI Network板塊的核心。這些解決方案能夠?qū)W(wǎng)絡(luò)設(shè)備的性能、協(xié)議一致性、安全性等進(jìn)行全面的測試與驗證。

4. KAI Power(KAI能效):聚焦于數(shù)據(jù)中心的能源效率。“數(shù)據(jù)中心的盡頭是電站”,這句行業(yè)內(nèi)的調(diào)侃精準(zhǔn)地道出了功耗問題的嚴(yán)峻性。一個十萬卡集群的耗電量,甚至超過一座百萬人口的城市。而KAI Power解決方案,專注于測試和驗證電源模塊、功率器件的性能,幫助客戶提升能源轉(zhuǎn)換效率,降低整體擁有成本(TCO)。

是德科技的目標(biāo)是,通過這套覆蓋全棧、全生命周期(從研發(fā)、生產(chǎn)到安裝維護(hù))的解決方案,幫助客戶構(gòu)建更高效、更可靠的AI基礎(chǔ)設(shè)施。

為將KAI的戰(zhàn)略構(gòu)想落地,是德科技發(fā)布了三款針對性的新產(chǎn)品,分別切入物理層、網(wǎng)絡(luò)層和應(yīng)用層的驗證需求。

“GPU閑置過半,器件逼近物理極限”?是德科技如何應(yīng)對AI基礎(chǔ)設(shè)施之困

第一款產(chǎn)品:224G單通道和雙通道采樣示波器。

該產(chǎn)品旨在滿足下一代光電互連技術(shù)的測試需求。隨著行業(yè)向單通道224Gb/s的速率演進(jìn)(這是實現(xiàn)1.6T及以上帶寬的基礎(chǔ)),測試儀器的精度至關(guān)重要。是德科技推出的這款224G采樣示波器,其核心器件是德科技久負(fù)盛名的自研技術(shù)——磷化銦(InP)技術(shù),在示波器的噪聲和抖動等關(guān)鍵指標(biāo)上表現(xiàn)出色,為光芯片、光模塊等組件廠商提供了精準(zhǔn)的物理層驗證工具。

第二款產(chǎn)品:INPT-1600GE網(wǎng)絡(luò)互連與性能測試設(shè)備。

當(dāng)光模塊等組件被集成到網(wǎng)卡、交換機等設(shè)備后,驗證工作便從物理層上升到了傳輸層和網(wǎng)絡(luò)層。李堅介紹,這款產(chǎn)品速率達(dá)到1.6T,其創(chuàng)新之處在于融入了更多針對Layer 2 FEC(前向糾錯編碼)的分析功能。更重要的是,它具備進(jìn)行“極限性能測試”的獨特能力。傳統(tǒng)的測試大多是在靜態(tài)、理想的條件下進(jìn)行。但真實工作環(huán)境中,模塊的性能會受到溫度、鏈路質(zhì)量等多種動態(tài)因素的影響。這款產(chǎn)品能夠模擬這些極限工況,對模塊進(jìn)行動態(tài)壓力測試,評估其性能邊界,而不僅僅是做一個簡單的“通過/不通過”判斷。這一功能已申請專利,體現(xiàn)了是德科技對真實應(yīng)用場景的深刻理解。

第三款產(chǎn)品:工作負(fù)載仿真器。

這是三款新品中最具創(chuàng)新性、也最貼近AI應(yīng)用實際的一款。李堅指出,當(dāng)下的AI算力網(wǎng)絡(luò),其流量模型與傳統(tǒng)數(shù)據(jù)中心有著天壤之別。傳統(tǒng)數(shù)據(jù)中心多為“南北向流量”(客戶端到服務(wù)器),而AI數(shù)據(jù)中心則充斥著大量GPU之間、節(jié)點之間的“東西向流量”,且這些流量往往是脈沖式的、非均衡的。如果交換機、網(wǎng)卡中的流量管控和調(diào)度算法(好比道路上的紅綠燈系統(tǒng))設(shè)計不合理,就會導(dǎo)致網(wǎng)絡(luò)擁堵,造成GPU大量等待。

這款工作負(fù)載仿真器,可用于評估網(wǎng)絡(luò)是否高效。它是一款主要運行在是德科技AresONE硬件平臺上的軟件,通過在網(wǎng)絡(luò)部署前進(jìn)行仿真測試,可以提前發(fā)現(xiàn)并優(yōu)化交換機、網(wǎng)卡中的調(diào)度算法,從而有效避免上線后出現(xiàn)性能瓶頸,降低運維成本。李堅透露,是德科技是行業(yè)內(nèi)率先提供此類仿真能力的公司,并已在北美與一些超大規(guī)模云服務(wù)商完成了相關(guān)驗證。

深耕中國40年:與本土創(chuàng)新同頻共振

回顧是德科技的發(fā)展史,可追溯到1939年的惠普公司。作為惠普最初的測試和測量業(yè)務(wù)部門,他們開啟了為客戶提供設(shè)計與仿真解決方案的旅程。歷經(jīng)85年后,這支隊伍先是成為安捷倫科技的一部分,并最終在十年前獨立出來,成為今天的“是德科技”。所以,盡管公司本身看似年輕,但它的技術(shù)傳承已跨越近一個世紀(jì)。

“GPU閑置過半,器件逼近物理極限”?是德科技如何應(yīng)對AI基礎(chǔ)設(shè)施之困

Kailash強調(diào),是德科技的使命是“加速創(chuàng)新,創(chuàng)造一個安全互聯(lián)的世界”。為此,公司戰(zhàn)略有三個核心支柱。

首先,在客戶產(chǎn)品的極早期階段,便與之深度合作,確保全生命周期的陪伴。其次,大力搞研發(fā),不斷提高自身的技術(shù)能力。最后,通過廣泛合作,包括積極參與全球標(biāo)準(zhǔn)化組織,推動技術(shù)標(biāo)準(zhǔn)的制定與落地,從而賦能整個生態(tài)。

Kailash總結(jié)說,無論是產(chǎn)業(yè)鏈上游的半導(dǎo)體公司,中游的模塊與組件制造商,還是下游集成這些組件構(gòu)建路由器、交換機等大型子系統(tǒng)的設(shè)備商,或是超大規(guī)模云服務(wù)提供商(Hyperscaler),是德科技為產(chǎn)業(yè)鏈的每一個環(huán)節(jié)提供各類解決方案。無論是AI還是6G,是德科技與客戶攜手,共同推動這些顛覆性技術(shù)在中國乃至全球的商業(yè)化進(jìn)程。

談及中國市場,是德科技高級副總裁兼首席營銷官Marie Hattar,介紹了是德科技與中國市場長達(dá)40余年的淵源。

“GPU閑置過半,器件逼近物理極限”?是德科技如何應(yīng)對AI基礎(chǔ)設(shè)施之困

是德科技高級副總裁兼首席營銷官Marie Hattar

從當(dāng)年作為惠普的團(tuán)隊開始,是德科技就開始服務(wù)中國客戶,盡管中間經(jīng)歷了安捷倫等公司的分拆,但是德科技與中國客戶的合作就一直沒有斷過。Marie自豪地表示,如今的是德科技,是一家專注于設(shè)計、仿真和測試的創(chuàng)新型公司,與中國客戶共同成長,將業(yè)務(wù)版圖擴展到了通信、半導(dǎo)體、汽車、航空航天等多個關(guān)鍵領(lǐng)域。

“GPU閑置過半,器件逼近物理極限”?是德科技如何應(yīng)對AI基礎(chǔ)設(shè)施之困

為了支撐中國市場發(fā)展,是德科技深耕本地化布局。目前,公司在大中華區(qū)擁有超過1000名員工,分布在10多個城市,且在中國多個城市設(shè)立開放式實驗室(Open Lab)。Marie特別指出了在北京的研發(fā)中心,該中心專注于軟件開發(fā),確保更貼近市場需求,以“中國速度”推動創(chuàng)新。

以汽車領(lǐng)域為例。Marie認(rèn)為,中國正迅速成為全球汽車行業(yè)的領(lǐng)導(dǎo)者,是德科技在全球設(shè)立的四座汽車客戶中心里,其中一座就落戶上海。這不僅是因為中國家用車市場的蓬勃,更是因為自動駕駛出租車、自動駕駛送貨車等新興業(yè)態(tài),在中國快速涌現(xiàn)。

“GPU閑置過半,器件逼近物理極限”?是德科技如何應(yīng)對AI基礎(chǔ)設(shè)施之困

在市場觸達(dá)方面,是德科技同樣遵循本地化發(fā)展。考慮到中國客戶的溝通習(xí)慣向社交平臺遷移,他們不再只依賴官網(wǎng),而是將微信和公眾號作為與客戶互動的主陣地。同時考慮到視頻受眾,是德科技還入駐了B站,展示各種產(chǎn)品評測教程。

不難看出,在這個步履不停的AI賽場,是德科技作為“基礎(chǔ)設(shè)施賦能者”的一員,顯然已經(jīng)找到了自己的獨特價值。

分享至
8贊

好文章,需要你的鼓勵

周雅

Miranda
關(guān)注科技創(chuàng)新、技術(shù)投資。以文會友,左手硬核科技,右手浪漫主義。
推薦文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-