朋友圈里好多人都在說“東數(shù)西算”,東數(shù)西算對咱老百姓的生活有什么影響呢?小美就“東數(shù)西算”問題,請教了一下悟空博士。
小美:東數(shù)西算中的“數(shù)”和“算”究竟是什么?
悟空博士:從技術(shù)角度來看,“數(shù)”指的是數(shù)據(jù),“算”指的是算力。大家耳熟能詳?shù)?ldquo;南水北調(diào)”、“西氣東輸”和“東數(shù)西算”有點(diǎn)類似,“東數(shù)西算”也屬于資源跨地域調(diào)度。“東數(shù)西算”是就是把東部產(chǎn)生大量的業(yè)務(wù)數(shù)據(jù),通過網(wǎng)絡(luò)傳送到西部的數(shù)據(jù)中心,由西部的數(shù)據(jù)中心,經(jīng)過計算的處理后,再返回到東部。
小美:悟空博士,東數(shù)西算是怎么來的呢?
悟空博士:東數(shù)西算其實(shí)是一個國家的重大工程。2021年5月24日,國家發(fā)展改革委、中央網(wǎng)信辦、工業(yè)和信息化部、國家能源局聯(lián)合印發(fā)了《全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實(shí)施方案》。文件提出,在京津冀、長三角、粵港澳大灣區(qū)、成渝,以及貴州、內(nèi)蒙古、甘肅、寧夏等地布局建設(shè)全國一體化算力網(wǎng)絡(luò)國家樞紐節(jié)點(diǎn),發(fā)展數(shù)據(jù)中心集群,引導(dǎo)數(shù)據(jù)中心集約化、規(guī)?;?、綠色化發(fā)展。國家樞紐節(jié)點(diǎn)之間進(jìn)一步打通網(wǎng)絡(luò)傳輸通道,加快實(shí)施“東數(shù)西算”工程,提升跨區(qū)域算力調(diào)度水平。這是東數(shù)西算的緣起。
小美:悟空博士,為什么東數(shù)西算在今年開始就頻頻聽到這個詞了呢,今年的兩會,也有很多代表的提案跟東數(shù)西算有關(guān)?
悟空博士:在今年2月17日,國家發(fā)改委、中央網(wǎng)信辦、工業(yè)和信息化部、國家能源局聯(lián)合印發(fā)通知,同意在京津冀、長三角、粵港澳大灣區(qū)、成渝、內(nèi)蒙古、貴州、甘肅、寧夏等8地啟動建設(shè)國家算力樞紐節(jié)點(diǎn),并規(guī)劃了10個國家數(shù)據(jù)中心集群。“東數(shù)西算”工程就算正式全面啟動了,東數(shù)西算就落到了實(shí)施層面。
小美:悟空博士,為什么叫東數(shù)西算呢?
悟空博士:大家普遍會比較好理解東西部之間的數(shù)字鴻溝,東部和西部之間一直存在著經(jīng)濟(jì)、文化等等差異,國家提出“東數(shù)西算”,就是把東部的數(shù)據(jù)拿到西部去計算,也是類似,東部和西部的資源不同,在全國上下發(fā)展數(shù)字經(jīng)濟(jì)的時候,也要從資源的調(diào)度層面去考量,通盤布局。
東部人口多,經(jīng)濟(jì)發(fā)達(dá),相對應(yīng),東部的手機(jī)等等各種設(shè)備使用量大,使用頻次高,東部的需要計算、處理的數(shù)據(jù)多,就出現(xiàn)了算力資源不夠的問題。
小美:東數(shù)西算的意思,就是東部的算力用量大,算力資源不夠了?
悟空博士:對,與西部相比,東部的人口密度大,信息通信應(yīng)用密度大,東部的經(jīng)濟(jì)基礎(chǔ)好,數(shù)字化轉(zhuǎn)型也在加速,各行各業(yè)的數(shù)字化需求持續(xù)增長,對算力的需求也越來越多。這與東部的算力資源供應(yīng),形成了鮮明的對比。
如果單靠東部算力增速,已然無法滿足東部自身的需求,因此,解決這一問題的思路,就是要從西部找出路。
小美:當(dāng)年唐僧是去西天取經(jīng),現(xiàn)在是從西部找出路,就是缺啥補(bǔ)啥唄。是不是就就像“南水北調(diào)”、“西氣東輸”是在將資源進(jìn)行重新分配?
悟空博士:是的,“東數(shù)西算”就如同“南水北調(diào)”、“西氣東輸”,把水,氣這樣的資源送到缺少資源,需要資源的地方去。
小美:水和氣都是天然的,中國的南北因為水資源豐富,所以“南水北調(diào)”,那西部的算力資源豐富嗎?
悟空博士:算力是一種人造的資源,所謂的人造,就是和水、氣不一樣,不是天然資源,要用人為的方式制造出來。制造出算力,依仗的資源主要是電力成本,當(dāng)然,還有土地、人才成本等等。
小美:既然算力不是現(xiàn)成的,那西部應(yīng)該也沒有現(xiàn)成的算力資源,是不是也需要來制造?
悟空博士:西部的算力資源也不是現(xiàn)成的,所以要建成渝、內(nèi)蒙古、貴州、甘肅、寧夏等算力樞紐。
小美:東部的算力資源的緊張,靠西部算力先“造血”,再來為東部“輸血”?
悟空博士:是的,不斷增長的數(shù)據(jù)需要日益增長的算力來支持,在東部地區(qū)由于土地、電力等限制,達(dá)到算力供應(yīng)的飽和狀態(tài)后,就需要外部資源的支持,也就是說持續(xù)增長的數(shù)據(jù),需要引入外部算力的支援和助力。
小美:悟空博士,既然算力資源也是人為制造的,那西部的算力資源是不是比東部的算力資源更容易得到?
悟空博士:從成本角度考慮,東部的土地成本、人才成本都高于西部,自然而然可以理解,在“雙碳”目標(biāo)的大前提下,電力成本對東部地區(qū)來說,也變成了奢侈品。東部的數(shù)據(jù)如果繼續(xù)放在東部的算力資源去處理,無疑增加了東部自身數(shù)字經(jīng)濟(jì)發(fā)展的準(zhǔn)入門檻。所以,不如把一部分?jǐn)?shù)據(jù)拿到西部去算。
小美:把東部的數(shù)據(jù)拿到西部去計算,是不是可以理解為,東數(shù)西算也是一種人為的資源調(diào)配?
悟空博士:是的,說到底,東數(shù)西算,也是尋求資源的平衡。
東數(shù)西算,其實(shí)是追求算力和數(shù)據(jù)能力的動態(tài)平衡。
小美:聽上去還有大學(xué)問,我下次再請教吧。
【作者】
中國信通院云大所副總工程師 王蘊(yùn)韜(悟空博士)
科技行者執(zhí)行總編輯 孫封蕾(小美)
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團(tuán)隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊通過對比實(shí)驗發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強(qiáng)于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。
琢磨技術(shù)發(fā)展史,關(guān)注算力產(chǎn)業(yè),關(guān)注數(shù)字經(jīng)濟(jì)。
參與編寫了《開源法則》(人民郵電出版社),《人類計算簡史:從中國算盤到數(shù)字經(jīng)濟(jì)》(中共中央黨校出版社)。