av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃,關注公眾號

  • 科技行者

  • 算力行者

見證連接與計算的「力量」

首頁 阿里云李飛飛:將大模型,裝進數(shù)據(jù)庫里

阿里云李飛飛:將大模型,裝進數(shù)據(jù)庫里

2025-02-28 11:01
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-02-28 11:01 ? 金旺

阿里云李飛飛:將大模型,裝進數(shù)據(jù)庫里

作者 | 金旺

來源 | 科技行者

預計2027年,云數(shù)據(jù)庫將占據(jù)整個數(shù)據(jù)庫市場份額的70%。

這是Gartner在2019年給出的預測數(shù)據(jù),從Gartner最新的統(tǒng)計數(shù)據(jù)來看,截至2023年年底,云數(shù)據(jù)庫在整個數(shù)據(jù)庫市場中占比已經(jīng)高達61%,這時的云數(shù)據(jù)庫已經(jīng)成為大勢所趨。

與此同時,人工智能技術的驟變,開始影響數(shù)據(jù)庫產(chǎn)業(yè),數(shù)據(jù)庫再次成為人工智能從技術到商業(yè)化的一個關鍵平臺。

Gartner高級研究總監(jiān)顧星宇指出,“到2028年,80%的生成式AI業(yè)務應用將在企業(yè)現(xiàn)有的數(shù)據(jù)管理平臺上開發(fā),從而將實施復雜性和交付時間縮短50%。”

作為云數(shù)據(jù)庫的堅實擁躉,阿里云智能集團副總裁、阿里云智能數(shù)據(jù)庫產(chǎn)品事業(yè)部負責人李飛飛則斷言,“第一波人工智能浪潮是由Native AI群體掀起,但在人工智能進入下半場后,本質(zhì)上已經(jīng)回歸到系統(tǒng)領域,回到了工程化問題上。”

也是在這時,阿里云PolarDB看到了他們的機會,進行了又一次產(chǎn)品迭代,也面向人工智能推出了PolarDB-Model as an Operator。

01 千機集群打出一個世界紀錄

2月26日,在2025阿里云PolarDB開發(fā)者大會上,阿里云官宣,PolarDB登頂全球數(shù)據(jù)庫性能及性價比排行榜, 并刷新了TPC-C性能和性價比雙榜的世界紀錄。

TPC-C測試,是由國際數(shù)據(jù)庫事務處理性能委員會(TPC)組織制定的模擬電商訂單服務場景,針對數(shù)據(jù)庫在線事務處理(OLTP)系統(tǒng)性能的一場長達40小時的極限基準測試。

其中,數(shù)據(jù)庫系統(tǒng)需要在極限壓力下運行8小時以上,在這期間,tpmC的波動率不能超過2%,還要保證數(shù)據(jù)正確率為100%,與此同時,測試模型還會模擬各種硬件故障情況,參與測試的產(chǎn)品需要確保數(shù)據(jù)不丟失,并能快速恢復正常性能。

阿里云李飛飛:將大模型,裝進數(shù)據(jù)庫里

這一基準測試歷來也有著數(shù)據(jù)庫領域“奧林匹克”之稱。

正是在這樣一個極為嚴苛的數(shù)據(jù)庫測試中,阿里云PolarDB團隊在2025年1月27日用1170臺物理機搭建了一個PolarDB集群,這個集群擁有2340個PolarDB主節(jié)點和2340個PolarDB從節(jié)點,最終支撐1.6億家商店、16億用戶跑出了每分鐘20.55億筆交易(tpmC),刷新了TPC-C性能排行榜,打破了世界紀錄。

在這次TPC-C測試過程中,阿里云PolarDB數(shù)據(jù)庫還刷新了另外三項成績:

第一,使用物理機數(shù)量相較于此前紀錄保持者(1650臺)少了三分之一;

第二,單虛擬核性能達到了18297tpmC,是此前紀錄保持者的1.8倍;

第三,單位成本0.8元(price/tpmC),是此前紀錄保持者的60%。

阿里云李飛飛:將大模型,裝進數(shù)據(jù)庫里

為什么PolarDB能在這場全行業(yè)矚目的基準測試中打出這樣的成績?

這其中的原因之一是PolarDB集群網(wǎng)絡部署從去年的25G Lossless RDMA升級到了100G Lossy高性能RDMA網(wǎng)絡,基于這樣的RDMA網(wǎng)絡,PolarDB團隊可以搭建連接數(shù)千臺,乃至上萬臺物理機的集群,并實現(xiàn)了高性能事務一致性執(zhí)行能力,多節(jié)點復制能力也由此提升了1倍。

具體到TPC-C測試中,這樣的高性能RDMA網(wǎng)絡帶來的一個變化是,PolarDB的上千臺物理機集群跨機業(yè)務對性能的影響得以被控制到7%以內(nèi)。

據(jù)阿里云智能集團數(shù)據(jù)庫產(chǎn)品事業(yè)部PolarDB MySQL及PostgreSQL負責人楊辛軍在發(fā)布會上透露,“PolarDB這次打榜最終達到的20.55億tpmC成績并不是我們的極限,實際上,PolarDB可以跑得更好。”

阿里云李飛飛:將大模型,裝進數(shù)據(jù)庫里

TPC-C是一個相當真實的情景模擬,它會模擬用戶在電商進行購買操作,這其中,每個商店能夠支持的客戶人數(shù)和交易速度都有限制,每個商店僅支持10個虛擬用戶同時進行交易,商品數(shù)量也有一定限制,因此,最終交易性能與商品數(shù)量相關。

據(jù)楊辛軍介紹,“我們打榜后發(fā)現(xiàn),我們的限制并不是單機性能,而是存儲,由于我們當時并沒有購買足夠的存儲資源,如果當時我們購買了更更存儲資源,我們打出的成績理論上可以再提升,在相同物理機和節(jié)點數(shù)量下一直可以提升到28億tpmC。”

而之所以會有這次打榜,楊辛軍告訴我們,“這其實相當于是一次檢閱,在PolarDB的新升級的硬件上線給所有用戶用之前進行的一次檢閱,而這些硬件在打榜后,最終將會進入商用市場,為用戶提供服務。”

一并在這次發(fā)布會上發(fā)布的,不只有隨PolarDB打破世界紀錄并將進入市場的數(shù)據(jù)庫集群,還有阿里云第一個CXL Switch內(nèi)存池數(shù)據(jù)庫。

02 打破“內(nèi)存墻”,CXL-Powered PolarDB亮相

作為新一代云原生數(shù)據(jù)庫,PolarDB的獨特之處在哪里?

李飛飛給出的解釋是:

“PolarDB通過三層解耦架構(gòu),在數(shù)據(jù)中心規(guī)模上實現(xiàn)了馮諾依曼架構(gòu),將擁有成千上萬臺服務器的數(shù)據(jù)中心變成一臺實現(xiàn)了計算、內(nèi)存、存儲三層解構(gòu)的云原生計算機。”

基于這樣的技術架構(gòu),PolarDB此次正式對外預發(fā)布了第一臺基于CXL Switch的數(shù)據(jù)庫專屬機型。

阿里云李飛飛:將大模型,裝進數(shù)據(jù)庫里

什么是CXL?

CXL是基于PCIe一種新型高速互聯(lián)技術,旨在解決計算系統(tǒng)中數(shù)據(jù)處理延遲、速度減慢和可擴展性問題,提供更高的數(shù)據(jù)吞吐量和更低的延時的接口標準,可以連接CPU、GPU、DRAM、存儲設備,解決CPU與設備、設備與設備之間的內(nèi)存鴻溝。

在當下大模型時代,內(nèi)存發(fā)展與算力增長速度的不匹配導致了“內(nèi)存墻”問題的出現(xiàn),基于CXL Switch的數(shù)據(jù)庫專屬機型在硬件上契合了PolarDB的三層解耦架構(gòu),并為解決大模型的“內(nèi)存墻”問題提供了解決思路。

據(jù)楊辛軍介紹,“以配備單根256GB內(nèi)存、連接7臺物理機的CXL Switch內(nèi)存池的PolarDB數(shù)據(jù)庫為例,一個機柜可以支持16TB的內(nèi)存容量,這時,每臺物理機都可以使用這16TB內(nèi)存容量。”

阿里云李飛飛:將大模型,裝進數(shù)據(jù)庫里

PolarDB通過使用CXL技術構(gòu)建三層分離數(shù)據(jù)庫,部署在遠端的數(shù)據(jù)庫并沒有因為跨機和跨地域?qū)е聰?shù)據(jù)庫性能下降,反而擴展性提升了3倍,而通過遠端數(shù)據(jù)庫替代本地數(shù)據(jù)庫的形式,數(shù)據(jù)庫成本也得以下降了50%。

對于基于CXL Switch內(nèi)存池化的機型,李飛飛在接受媒體采訪時特別強調(diào),“我們并不是要做線下市場、做一體機,這些機型最終都將會用到公共云上的PolarDB專屬資源池構(gòu)建中。”

PolarDB在Kernel層有各類壓縮算法,但李飛飛認為,“僅做這些還不夠,PolarDB還需要在磁盤SSD的控制上做優(yōu)化,由此才能真正做到軟硬件協(xié)同創(chuàng)新。”

李飛飛指出,“云原生是必然趨勢,任何系統(tǒng)向前演進僅做軟件創(chuàng)新是沒有未來的,一定要做軟硬件協(xié)同創(chuàng)新,DeepSeek證明了這一點,PolarDB的突破同樣證明了這一點。”

至于此次在發(fā)布會上亮相的CXL-Powered PolarDB,楊辛軍在發(fā)布會也強調(diào),“這次基于CXL Switch內(nèi)存池化的PolarDB數(shù)據(jù)庫只是預發(fā)布,還沒有正式應用到生產(chǎn)環(huán)境中。”

據(jù)悉,接下來PolarDB團隊還將會在GPU+CPU異構(gòu)資源池上繼續(xù)優(yōu)化,滿足大模型對于異構(gòu)算力的應用需求。

03 將大模型,裝進PolarDB里

隨著DeepSeek在年初的開源,大模型正式進入到了人工智能應用爆發(fā)的元年。

誰能抓住這波人工智能應用爆發(fā)的機會?

李飛飛認為,“只有那些將大模型更好地與現(xiàn)有業(yè)務流程、數(shù)據(jù)流程結(jié)合,把成本降低、把資源優(yōu)勢打滿、讓數(shù)據(jù)真正發(fā)揮出價值的企業(yè),才能抓住這波機會。”

自2025年,以大模型為代表的人工智能時代被劃分為上下半場,上半場的競爭焦點是大模型的預訓練,接下來大模型的預訓練將會呈現(xiàn)出在線化、集中式的趨勢,而下半場本質(zhì)上又回到了傳統(tǒng)的系統(tǒng)和工程領域。

對于數(shù)據(jù)庫廠商而言,“模型即算子”已經(jīng)不再是一個“if”,而成了正在發(fā)生的事,也是在此次發(fā)布會上,PolarDB-Model as an Operator正式對外發(fā)布。

阿里云李飛飛:將大模型,裝進數(shù)據(jù)庫里

李飛飛在發(fā)布會上介紹稱,“我們現(xiàn)在已經(jīng)可以把包括大模型在內(nèi)的各種各樣的模型作為算子內(nèi)嵌到數(shù)據(jù)庫引擎中,這樣為我們從數(shù)據(jù)中發(fā)現(xiàn)價值帶來了便利,為傳統(tǒng)OLAP的意義和方向會因此得到極大的拓展。”

這是李飛飛堅定看好的發(fā)展趨勢。

為此,PolarDB團隊將包括通義千問、DeepSeek等在內(nèi)的大模型作為算子內(nèi)嵌到了PolarDB數(shù)據(jù)庫中,利用PolarDB的三層解耦架構(gòu)和多主多寫能力彈性伸縮出人工智能推理節(jié)點。

這一波操作下來,極大地簡化了企業(yè)部署和應用大模型過程中數(shù)據(jù)管道,企業(yè)不再需要將數(shù)據(jù)轉(zhuǎn)移到專有推理平臺上,將推理結(jié)果拿回來再進行業(yè)務判斷。

實際上,PolarDB-Model as an Operator不僅僅是將大模型內(nèi)嵌到了PolarDB數(shù)據(jù)庫中,還針對大模型做了一系列優(yōu)化。

阿里云李飛飛:將大模型,裝進數(shù)據(jù)庫里

楊辛軍告訴我們,“由于PolarDB特有的三層解耦架構(gòu)可以實現(xiàn)內(nèi)存的解耦,部署在PolarDB中的大模型就可以將CPU和GPU的資源充分利用起來,在同等GPU算力條件下,部署在PolarDB上的DeepSeek并行用戶訪問量可以提升35倍。”

與此同時,將大模型裝進數(shù)據(jù)庫也避免了企業(yè)私有數(shù)據(jù)出域,為企業(yè)數(shù)據(jù)安全和大模型應用提供了一個新思路。

分享至
0贊

好文章,需要你的鼓勵

金旺

Wille
關注智造、硬件、機器人。
推薦文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-