作者|周雅
AI狂潮的同時(shí),科技圈迎來了一場(chǎng)“快行動(dòng)”。隨之而來的,是數(shù)據(jù)的狂潮:模型訓(xùn)練過程中,為了防止很貴的GPU算力中斷,要頻繁寫入巨大的快照;推理應(yīng)用則要求對(duì)海量數(shù)據(jù)進(jìn)行實(shí)時(shí)且低延遲的讀取。那么,我們?cè)撛趺礉M足AI時(shí)代的存儲(chǔ)需求?
這個(gè)問題,慧榮科技企業(yè)級(jí)儲(chǔ)存事業(yè)部產(chǎn)品行銷應(yīng)用部資深協(xié)理周宗廉(Tsunglian Chou)在2025全球閃存峰會(huì)上,試圖給出一個(gè)答案,不過他的答案并非一個(gè)具體的性能指標(biāo),也不是一款單一的芯片,而是更深層次的戰(zhàn)略思考。
慧榮科技企業(yè)級(jí)儲(chǔ)存事業(yè)部產(chǎn)品行銷應(yīng)用部資深協(xié)理周宗廉(Tsunglian Chou)
重新定義游戲規(guī)則:從“做一盤菜”到“遞上一整套廚房”
“AI是存在很久的技術(shù),而且它一直在演進(jìn)。”周宗廉的開場(chǎng)白,試圖將大家拉回到一個(gè)更長(zhǎng)的時(shí)間尺度。他提到了1966年MIT推出的第一款聊天機(jī)器人“ELIZA” ——一個(gè)僅用200行代碼寫成聊天機(jī)器人的“老古董”。從ELIZA到今天動(dòng)輒千億參數(shù)的大模型,背后是算力和存儲(chǔ)空間跨越近60年的天文數(shù)字級(jí)增長(zhǎng)。
這種增長(zhǎng),在DeepSeek等開源模型將大模型訓(xùn)練成本拉下神壇后,正以前所未有的態(tài)勢(shì)向下滲透,從“云端”涌向“邊緣“,Edge AI的應(yīng)用也會(huì)大幅普及。智能手機(jī)、PC、AI Pin、智能眼鏡……萬物皆可AI的時(shí)代,數(shù)據(jù)產(chǎn)生的規(guī)模和速度,正在讓傳統(tǒng)存儲(chǔ)架構(gòu)捉襟見肘。
面對(duì)這場(chǎng)數(shù)據(jù)洪水,傳統(tǒng)的芯片廠商模式是,設(shè)計(jì)一顆強(qiáng)大的芯片,然后賣給客戶,這似乎已經(jīng)不夠了。因?yàn)榭蛻粜枰模缫巡皇且活w更快的CPU或GPU,而是一套能讓他們快速、穩(wěn)定、低成本地造出好產(chǎn)品的完整解決方案。
慧榮科技給出的答案是 MonTitan™。
“MonTitan™不是一顆芯片,而是一個(gè)平臺(tái)。”周宗廉在演講和后續(xù)的采訪中,反復(fù)強(qiáng)調(diào)這個(gè)概念。MonTitan™ 包含了三樣?xùn)|西:
1、一顆頂尖的SSD主控芯片(例如SM8366)。
2、一套完整的硬件參考設(shè)計(jì)(包括原理圖)。
3、一套企業(yè)級(jí)的固件,它是SSD效能或者功能的核心。
這套組合拳的威力,需要從兩個(gè)視角來理解:慧榮的直接客戶(SSD制造商)和終端客戶(數(shù)據(jù)中心、云服務(wù)商)。
對(duì)于直接客戶,MonTitan™ 的價(jià)值是“賦能”。周宗廉在采訪中打了一個(gè)比方:
“你可以想象,客戶的核心競(jìng)爭(zhēng)力是‘做出一盤好吃的菜’。而我們,就是把整個(gè)廚房,從灶臺(tái)、鍋具到水電煤都幫你設(shè)計(jì)好、鋪設(shè)好。你只需要專注于你的‘廚藝’,而不用去研究這臺(tái)洗碗機(jī)內(nèi)部的管線是怎么走的。我們把‘洗碗’這個(gè)動(dòng)作,封裝成一個(gè)簡(jiǎn)單的按鈕,你按一下就行了。”
這種“封裝”的背后,是MonTitan™ 極具彈性的架構(gòu)。慧榮的工程師們將硬件設(shè)計(jì)成一個(gè)個(gè)獨(dú)立的、強(qiáng)大的“引擎”,這些引擎彼此隔離,完全由固件來調(diào)度和指揮。“就像廚房里,洗碗的、烘干的、切菜的,各司其職,互不干擾,但總指揮(固件)可以靈活地編排流程。”周宗廉解釋道。
這樣做最大的好處是什么?客戶過去積累的知識(shí)產(chǎn)權(quán)(IP)和固件代碼,可以非常平滑地移植到MonTitan™ 平臺(tái)上,而不需要推倒重來。這極大地縮短了產(chǎn)品的上市時(shí)間,并降低了研發(fā)成本。在一個(gè)“天下武功,唯快不破”的市場(chǎng)里,這幾乎是決定生死的優(yōu)勢(shì)。
而對(duì)于云服務(wù)商這樣的終端客戶,他們感受到的則是實(shí)在的性能和體驗(yàn)飛躍。以MonTitan™ 平臺(tái)下的首款旗艦產(chǎn)品SM8366為例,這顆基于12nm制程的PCIe Gen5主控,可以實(shí)現(xiàn)超過14GB/s的順序讀取速度和3.5M IOPS的隨機(jī)讀取性能。
慧榮科技SM8366
“我們?cè)O(shè)計(jì)之初的目標(biāo)就很明確,”周宗廉說,“PCIe Gen5就像一個(gè)巨大的水管,我們必須保證芯片內(nèi)部的每一個(gè)環(huán)節(jié),都能處理這么大的水量,從前端進(jìn)來的水流,在后端要被完全‘榨干’,不能有任何瓶頸。”
這種極致性能,意味著數(shù)據(jù)中心可以更快地完成大模型訓(xùn)練或圖像化神經(jīng)網(wǎng)絡(luò)的構(gòu)建。但比性能更重要的,是慧榮對(duì)真實(shí)應(yīng)用場(chǎng)景的深刻洞察。
深入無人區(qū):用PerformaShape™ 馴服云端的“吵鬧鄰居”
企業(yè)級(jí)SSD最常遇到的工作環(huán)境是什么?是多租戶(Multi-tenancy)。
想象一個(gè)云端數(shù)據(jù)中心,成百上千個(gè)不同的用戶(租戶)在同時(shí)訪問同一塊SSD。如果沒有有效的管理,就很容易出現(xiàn)“吵鬧鄰居”問題:某一個(gè)用戶突然發(fā)起大量的讀寫請(qǐng)求,占滿了所有資源,導(dǎo)致其他用戶的請(qǐng)求延遲飆升,服務(wù)品質(zhì)(QoS)急劇下降。
這對(duì)于按服務(wù)等級(jí)付費(fèi)的云業(yè)務(wù)來說,是不可接受的。
傳統(tǒng)的解決方案,往往依靠軟件在主機(jī)端進(jìn)行調(diào)度,但這種方式精度差、延遲高。而慧榮的獨(dú)門秘技PerformaShape™,則是在主控芯片內(nèi)部,用硬件引擎來解決這個(gè)問題。
“PerformaShape™ 可以用硬件引擎設(shè)定每一個(gè)用戶的效能。”周宗廉解釋道,“限制效能、定義效能就意味著限制電源、定義電源,這意味著你可以控制每個(gè)通道的功耗,所有用戶的延遲都變得可被管理、可被預(yù)測(cè)。當(dāng)用戶效能都被我們掌握,就相當(dāng)于服務(wù)品質(zhì)被我們牢牢掌握。”
在慧榮展示的對(duì)比測(cè)試中,未使用PerformaShape™ 時(shí),多用戶并發(fā)寫入的IO波動(dòng)劇烈,像一張狂亂的心電圖;而啟用后,曲線瞬間變得平滑如水,一致性高達(dá)95%以上。
這種技術(shù)的價(jià)值,在RocksDB這樣的真實(shí)應(yīng)用中被展現(xiàn)得淋漓盡致。
RocksDB是Facebook(現(xiàn)Meta)基于LevelDB開發(fā)的開源鍵值數(shù)據(jù)庫,被廣泛應(yīng)用于各種需要高速讀寫的場(chǎng)景。它的核心機(jī)制,是將數(shù)據(jù)分層存儲(chǔ)在SSD中,高層級(jí)(L0)的文件小、訪問頻繁、對(duì)延遲要求極高;低層級(jí)的文件大、訪問頻率低、延遲較高。
“我們發(fā)現(xiàn),PerformaShape™ 可以完美地釋放RocksDB的潛力。”周宗廉說。利用PerformaShape™,開發(fā)者可以為RocksDB中不同層級(jí)的數(shù)據(jù)流分配不同的性能通道——為要求最苛刻的L0層分配最高優(yōu)先級(jí)的性能和最低的延遲,而為其他層級(jí)分配普通通道。
“市面上有些廠商也針對(duì)RocksDB做了FDP(Flexible Data Placement,一種讓主機(jī)能指導(dǎo)SSD數(shù)據(jù)存放位置的技術(shù)),我們覺得這是很好的做法。但FDP只解決了‘放哪里’的問題,沒有解決‘怎么服務(wù)’的問題。”周宗廉補(bǔ)充道,“FDP加上PerformaShape™,才是完美的組合。”
這種對(duì)應(yīng)用層需求的深刻理解和技術(shù)實(shí)現(xiàn),構(gòu)成了慧榮在激烈競(jìng)爭(zhēng)中最堅(jiān)固的護(hù)城河。它不再是簡(jiǎn)單地堆砌性能參數(shù),而是真正深入到客戶的業(yè)務(wù)邏輯中,解決他們最棘手的痛點(diǎn)。
戰(zhàn)略家的耐心:“好飯不怕晚”
在瞬息萬變的半導(dǎo)體行業(yè),有一種普遍的焦慮,叫做“首發(fā)焦慮”。第一個(gè)發(fā)布支持最新技術(shù)標(biāo)準(zhǔn)的產(chǎn)品,似乎就能搶占先機(jī)、贏得市場(chǎng)。
但慧榮科技,似乎想要穩(wěn)步前進(jìn)。
當(dāng)PCIe Gen5標(biāo)準(zhǔn)已經(jīng)問世一段時(shí)間,市面上甚至出現(xiàn)了一些發(fā)熱量驚人、穩(wěn)定性堪憂的“早產(chǎn)兒”時(shí),慧榮卻并不急于沖刺。
“我們公司有個(gè)特征,可能不是第一個(gè)跑步的人,但我們出來的東西,一定是大家都可以用的。”周宗廉在采訪中坦言,“中國臺(tái)灣話里有句話叫‘好酒沉甕底’(好酒都在壇子底),我們更信奉‘好飯不怕晚’。”
這種看似“慢”的節(jié)奏,背后是一種極其清醒的商業(yè)判斷和戰(zhàn)略耐心。
“我們?yōu)槭裁纯梢赃@么早知道市場(chǎng)節(jié)奏?因?yàn)槲覀円恢备钋岸说挠脩魪S商、NAND原廠保持著非常緊密的溝通,我們幾乎是共同在開發(fā)東西。”周宗廉透露,“所以我們很早就看到,PCIe Gen5的市場(chǎng)(指服務(wù)器端)根本還沒有真正起來。我們那個(gè)時(shí)候不急著把產(chǎn)品推向市場(chǎng),反而利用這段時(shí)間,將制程從最初規(guī)劃的16nm優(yōu)化到了12nm,解決了潛在的過熱問題。”
等到服務(wù)器市場(chǎng)真正準(zhǔn)備好迎接PCIe Gen5時(shí),慧榮端出的SM8366,是一款成熟、穩(wěn)定、高性能且功耗控制優(yōu)秀的產(chǎn)品,市場(chǎng)接受度因此非常高。“你為了搶第一名,拿出一個(gè)不能用的東西,是沒有意義的。”
這種“慢思考”,貫穿于慧榮的產(chǎn)品規(guī)劃和研發(fā)投入中。在設(shè)計(jì)一顆芯片動(dòng)輒耗資數(shù)千萬甚至上億美元的今天,尤其是在采用臺(tái)積電這樣的先進(jìn)且昂貴的制程時(shí),每一次流片失敗的代價(jià)都是巨大的。
慧榮的應(yīng)對(duì)之道,是近乎苛刻的事前驗(yàn)證。
“我們選擇先進(jìn)制程,就必須想盡一切辦法減少改版的次數(shù)。”周宗廉坦言,“這意味著在芯片設(shè)計(jì)出來、投入生產(chǎn)之前,就要做好萬全的系統(tǒng)級(jí)驗(yàn)證,用各種方法把可能的問題都暴露出來、解決掉。這沒有捷徑,只能靠小心、再小心。”
這種對(duì)成本的敬畏、對(duì)市場(chǎng)的尊重、對(duì)產(chǎn)品質(zhì)量的堅(jiān)守,共同構(gòu)成了慧榮的慢思考:在喧囂的浪潮中保持定力,在正確的時(shí)間點(diǎn),拿出正確的產(chǎn)品。
看向未來,我們有一條清晰路徑
有了堅(jiān)實(shí)的平臺(tái)和清晰的思考,慧榮對(duì)未來的布局顯得從容而篤定。
首先,擁抱QLC NAND。
隨著AI模型和數(shù)據(jù)集的爆炸式增長(zhǎng),對(duì)存儲(chǔ)容量的需求已經(jīng)進(jìn)入TB甚至PB時(shí)代。在成本的約束下,使用每個(gè)單元能存儲(chǔ)4比特?cái)?shù)據(jù)的QLC NAND,成為打造超大容量SSD的必然選擇。
但QLC的“體質(zhì)”相對(duì)脆弱,壽命和性能都不及TLC。這就需要主控芯片具備更強(qiáng)大的糾錯(cuò)、磨損均衡和數(shù)據(jù)管理能力。“FDP這樣的技術(shù),就是保護(hù)QLC這種‘嬌貴’NAND顆粒的絕佳手段。”周宗廉指出。在今年的CFMS(2025中國閃存市場(chǎng)峰會(huì))上,慧榮就展示了基于SM8366和QLC NAND的128TB SSD,這是其技術(shù)實(shí)力的最佳證明。
其次,分層布局、精準(zhǔn)卡位。
除了旗艦級(jí)的SM8366,MonTitan™ 平臺(tái)還衍生出了更專注細(xì)分市場(chǎng)的產(chǎn)品:
· SM8388:一顆針對(duì)近線存儲(chǔ)的主控。這類存儲(chǔ)對(duì)延遲要求不像在線業(yè)務(wù)那么高,但對(duì)容量、成本和功耗極其敏感。SM8388正是為此而生,它以更低的功耗和成本,支持高達(dá)128TB的容量,被慧榮視為取代部分傳統(tǒng)HDD(機(jī)械硬盤)市場(chǎng)的利器。
· SM8466:一顆瞄準(zhǔn)未來的PCIe Gen6主控。它將采用臺(tái)積電4nm制程,支持高達(dá)512TB的容量,順序讀寫性能目標(biāo)直指28GB/s,隨機(jī)性能則高達(dá)7M IOPS。這顆芯片承載了慧榮對(duì)下一個(gè)五年、甚至十年存儲(chǔ)需求的預(yù)判。
“我們?cè)谝?guī)劃產(chǎn)品時(shí),一直都是往前看很遠(yuǎn),要確保我們做出來的東西,可以符合未來5-10年的需要。”周宗廉說。
最后,對(duì)CXL等新技術(shù)保持敏銳和務(wù)實(shí)。
對(duì)于CXL(Compute Express Link)這種能夠?qū)崿F(xiàn)內(nèi)存池化的熱門技術(shù),慧榮的態(tài)度是“認(rèn)真研究,持續(xù)觀察”。“我們看到CXL目前仍然是內(nèi)存廠商的舞臺(tái),在存儲(chǔ)領(lǐng)域的應(yīng)用還沒有看到特別的突破。我們會(huì)保持關(guān)注,但不會(huì)盲目跟進(jìn)。”
慧榮科技這種整體“平臺(tái)化”的戰(zhàn)略思維,是建立在次世代趨勢(shì)之上的,周宗廉認(rèn)為次世代的存儲(chǔ)趨勢(shì)有四大創(chuàng)新:
1、極致容量(High Capacity):AI時(shí)代,容量是王道。慧榮早已深入研發(fā)駕馭QLC NAND所需的核心算法,為迎接超大容量時(shí)代鋪平道路。
2、數(shù)據(jù)效率(Data Efficiency):通過合理、有效地放置數(shù)據(jù),最大限度減少無謂的數(shù)據(jù)搬移,從而保護(hù)NAND閃存的壽命和性能,這在QLC時(shí)代尤為關(guān)鍵。
3、安全堡壘(Data Security):在企業(yè)級(jí)應(yīng)用中,安全是必需品。慧榮的理念是,構(gòu)建端到端的安全體系,覆蓋數(shù)據(jù)本身(通過高性能加解密引擎)、數(shù)據(jù)完整性(端到端保護(hù))以及平臺(tái)自身的安全(如密鑰管理)。
4、綠色能效(Power Efficiency):隨著數(shù)據(jù)中心規(guī)模的膨脹,功耗與散熱已成為核心成本?;蹣s通過優(yōu)化芯片設(shè)計(jì)和選用更先進(jìn)的制程,從源頭上控制“電老虎”的胃口。
這四大創(chuàng)新支柱,最終轉(zhuǎn)化為MonTitan™平臺(tái)最鮮明的產(chǎn)品特點(diǎn):由眾多自研高速IP與智能固件共同驅(qū)動(dòng)的極致性能(Performance);以128TB QLC SSD為代表的超大容量(High Capacity);以及貫穿始終的低功耗(Low Power)與數(shù)據(jù)完整性(Data Integrity)。以上這套組合拳,構(gòu)成了慧榮應(yīng)對(duì)次世代存儲(chǔ)挑戰(zhàn)的完整答案。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。