上篇的《大話“東數(shù)西算”》里,說(shuō)到了東數(shù)西算是一種數(shù)據(jù)和計(jì)算的資源調(diào)配,但這種資源調(diào)配,和“南水北調(diào)”、“西氣東輸”又是大不同的。
小美:資源平衡可以理解,但數(shù)據(jù)的動(dòng)態(tài)平衡,是啥意思來(lái)?
悟空博士:大家不能簡(jiǎn)單的理解為東部的數(shù)據(jù)都要拿到西部去計(jì)算。如果這樣簡(jiǎn)單看,沒(méi)毛病,但并沒(méi)用厘清“東數(shù)西算”的大規(guī)劃。數(shù)據(jù)的動(dòng)態(tài)平衡是要先分清楚數(shù)據(jù)的分類,以此為基礎(chǔ),來(lái)理解東數(shù)西算了。
小美:悟空博士,那你快來(lái)說(shuō)一說(shuō),數(shù)據(jù)怎么分類?
悟空博士:數(shù)據(jù)也有很多分類,從應(yīng)用角度來(lái)看,數(shù)據(jù)可分為熱數(shù)據(jù)和冷數(shù)據(jù)。熱數(shù)據(jù)就是需要頻繁訪問(wèn),對(duì)計(jì)算實(shí)效有較高要求的數(shù)據(jù),比如我們點(diǎn)外賣,當(dāng)然需要系統(tǒng)及時(shí)的響應(yīng),那么這個(gè)數(shù)據(jù)就是熱數(shù)據(jù)。簡(jiǎn)單理解,就是我們經(jīng)常用到的數(shù)據(jù)。
小美:有熱,就有冷吧?
悟空博士:對(duì),還有一部分就是冷數(shù)據(jù),我們偶爾訪問(wèn)一下,對(duì)計(jì)算的時(shí)效性要求并不高,比如我們歸檔的電子郵件,偶爾想起來(lái)時(shí)候才會(huì)去看一眼。
小美:我知道了,冷數(shù)據(jù)和熱數(shù)據(jù)既然是按照平常用的應(yīng)用頻率來(lái)區(qū)分的,那么,這樣的區(qū)別,具體在“東數(shù)西算”中如何體現(xiàn)?
悟空博士:東數(shù)西算中的“數(shù)”,要看的是冷數(shù)據(jù)和熱數(shù)據(jù)之間的平衡,熱數(shù)據(jù)盡量留在距離用戶近的東部,而冷數(shù)據(jù)則運(yùn)到距離用戶較遠(yuǎn)的西部,數(shù)據(jù)的動(dòng)態(tài)平衡,放在這里,就是要隨著數(shù)據(jù)的冷熱進(jìn)行動(dòng)態(tài)的平衡。
小美:這種動(dòng)態(tài)平衡延伸開來(lái),也會(huì)引發(fā)一系列效應(yīng)吧?
悟空博士: 是的,算力在寸土寸金的東部自然要更貴一些,而在自然資源豐富的西部則更具價(jià)格優(yōu)勢(shì)。但成本同樣需要考慮到,數(shù)據(jù)往返運(yùn)送所涉及到的網(wǎng)絡(luò)成本,以及往返的時(shí)間成本等。
小美:東數(shù)西算是全國(guó)一盤大棋,考量的會(huì)更多吧?
悟空博士:對(duì)頭,東數(shù)西算既要考慮算力成本,也要考慮往返的網(wǎng)絡(luò)成本以及時(shí)間成本,是結(jié)合成本考量后的平衡布局,確保相關(guān)數(shù)據(jù)的計(jì)算能保持一個(gè)成本最優(yōu)解。
當(dāng)然,“東數(shù)西算”實(shí)現(xiàn)的是更大意義上的平衡。西部的數(shù)字經(jīng)濟(jì)也會(huì)隨著算力中心的潛移,而最終受益。
小美:西部能夠接收東部的數(shù)據(jù),說(shuō)明西部也有一些條件是適合來(lái)接收的,這其中有哪些契機(jī)。
悟空博士:電力成本、土地成本、人才成本放在西部,就降低了許多,因此,西部的算力就比東部的整體算力成本低,是彌補(bǔ)東部算力不足的劃算選擇。這些都是大家很容易想到的理由。
小美:那肯定還有很多大家不容易想到的理由了。
悟空博士:首先,技術(shù)是最不容忽視的,跟以往的資源調(diào)度所不同,“東數(shù)西算”之所以能提出,因?yàn)橛辛诵碌钠鯔C(jī):網(wǎng)絡(luò)能力逐步提升,互聯(lián)網(wǎng)架構(gòu)也在調(diào)整,這些讓“東數(shù)西算”成為可能。
小美:過(guò)去的網(wǎng)絡(luò)不能實(shí)現(xiàn)這樣的傳輸嗎?
悟空博士:過(guò)去的網(wǎng)絡(luò)傳輸能力還是有點(diǎn)“心有余,力不足”。傳輸海量的數(shù)據(jù),需要有強(qiáng)大的網(wǎng)絡(luò)。
曾經(jīng)有一個(gè)段子,亞馬遜為了計(jì)算處理數(shù)據(jù),公司用貨車?yán)脖P到數(shù)據(jù)中心來(lái)處理,而不是像想象中的那樣用“云”。
小美:原來(lái)還有這么一回事啊,下次咱們繼續(xù)說(shuō)。
作者:
中國(guó)信通院云大所副總工程師 王蘊(yùn)韜
科技行者執(zhí)行總編輯 孫封蕾
大話“東數(shù)西算”
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。
琢磨技術(shù)發(fā)展史,關(guān)注算力產(chǎn)業(yè),關(guān)注數(shù)字經(jīng)濟(jì)。
參與編寫了《開源法則》(人民郵電出版社),《人類計(jì)算簡(jiǎn)史:從中國(guó)算盤到數(shù)字經(jīng)濟(jì)》(中共中央黨校出版社)。