6月13日,在2022年阿里云峰會上,阿里云智能總裁張建鋒表示,阿里云今年最重要策略是“B2B”,也就是“Back to Basic”,回到云計算的本質(zhì),堅持在技術(shù)的長征路上,不斷取得新的突破。他認為,云計算進入了一個關(guān)鍵的突破期,“如果我們定義好下一代的云,中國云計算就有超車機會。”
圖:阿里云智能總裁張建鋒
他認為,過去十多年,云計算技術(shù)經(jīng)歷了兩個發(fā)展階段:第一階段是分布式和虛擬化技術(shù)替代了大型機、小型機,滿足了當時企業(yè)業(yè)務擴展帶來的算力彈性需求;第二階段出現(xiàn)了資源池化技術(shù),把計算和存儲資源分離,再規(guī)?;幣藕驼{(diào)度,提供了超大規(guī)模的計算和存儲資源池。
這兩個階段的演進推動云計算發(fā)展,但它們都是通過軟件定義的方法,基于傳統(tǒng)的以CPU為中心的體系架構(gòu)去做優(yōu)化,已經(jīng)觸及瓶頸。近年來,云上客戶的需求發(fā)生了很大變化,數(shù)據(jù)密集型的計算越來越多,不斷地提高了對云計算提供的低時延、高帶寬的需求,這些需求很難通過傳統(tǒng)體系結(jié)構(gòu)去滿足。
“這幾年,我們看到云計算進入了一個新的發(fā)展階段,我們越來越接近于下一個時代”,張建鋒表示,新一代的云計算要從數(shù)據(jù)中心的內(nèi)部做體系化創(chuàng)新,從以往的以CPU為中心的體系架構(gòu),進入以CIPU為中心的體系架構(gòu)。
當天,阿里云發(fā)布了一款云數(shù)據(jù)中心專用處理器CIPU(Cloud Infrastructure Processing Units 云基礎設施處理器),將替代CPU成為云時代IDC的處理核心。CIPU向下接入物理的計算、存儲、網(wǎng)絡資源,快速云化并進行硬件加速;向上接入飛天云操作系統(tǒng),管控阿里云全球上百萬臺服務器,讓算力虛擬化損耗降到0,并通過規(guī)?;瘧肦DMA網(wǎng)絡技術(shù),讓訪問云端比訪問本地硬盤更快。
這是一個全新的架構(gòu)體系,從最底層的數(shù)據(jù)中心核心部件到最上層云原生軟件,建立了完整的自研技術(shù)體系。“今天我們可以清晰地看到,阿里云做到了軟硬件完美結(jié)合,成為‘飛天+CIPU’支撐的云計算技術(shù)體系”,張建鋒說,阿里云核心技術(shù)一直走在世界前列,這個新型體系是技術(shù)長征路上的新的里程碑,這個新型的技術(shù)體系正在定義下一代云計算架構(gòu)。
在芯片層面,阿里云是全球支持CPU種類最多的云廠商,基于“一云多芯”戰(zhàn)略對X86、ARM、RISC-V等多種架構(gòu)進行適配,兼容飛騰、鯤鵬、AMD、Ampere等多種CPU,形成標準形態(tài)的算力輸出。同時,阿里云針對云計算大規(guī)模、高并發(fā)特性,推出自研CPU芯片倚天710。目前,倚天710已在阿里云數(shù)據(jù)中心內(nèi)部規(guī)?;渴?,并順利支撐2021年雙11等多個核心業(yè)務。今年4月,基于倚天710的公共云 ECS實例已上線邀測。
在網(wǎng)絡層面,阿里云建設了全球最大規(guī)模的RDMA分布式高性能網(wǎng)絡,CIPU對高帶寬物理網(wǎng)絡進行硬件加速,實現(xiàn)RDMA技術(shù)的普惠化。在存儲層面,CIPU對存算分離架構(gòu)的塊存儲進行加速,讓云端存儲比本地存儲更快,并擁有極大規(guī)模的資源池。在計算層面,通過CIPU把虛擬化開銷降到0,并提供硬件安全隔離功能。
目前,阿里云在全球云計算的市場和技術(shù)水平均處于領先地位,在權(quán)威機構(gòu)Gartner發(fā)布的年度報告里,阿里云的IaaS基礎設施能力、產(chǎn)品能力獲得了全球最高分。其中,在網(wǎng)絡技術(shù)上,阿里云被權(quán)威機構(gòu)AMiner評為全球十大最具影響力的網(wǎng)絡研究機構(gòu)。
同時,新一代云計算體系不僅會對云、對數(shù)據(jù)中心內(nèi)部產(chǎn)生影響,張建鋒認為,這也會改變傳統(tǒng)計算機終端形態(tài)、以及軟件應用和開發(fā)界面。
其中,對于計算機終端來說,阿里云推出的云電腦無影,將高算力工作從本地轉(zhuǎn)移到云端,釋放終端側(cè)的高性能硬件需求。今年云峰會上,無影宣布升級全新ASP云流協(xié)議,支持開發(fā)者打造8K畫質(zhì)體驗,并將時延控制在20毫秒內(nèi)。
張建鋒表示,釘釘希望為企業(yè)數(shù)字化提供一個統(tǒng)一的軟件界面,不用每個軟件單獨裝一個APP。此外,釘釘提供了非常多的基礎能力,例如通訊錄、組織架構(gòu)、權(quán)限控制、辦公、文檔、溝通等,并提供低代碼這樣的易用技術(shù),可以讓企業(yè)更快速地開發(fā)應用。截至2022年3月31日,釘釘已經(jīng)服務2100萬個企業(yè)和組織,這些企業(yè)在釘釘上開發(fā)的應用超過350萬個。
“云計算越來越接近進入下一個時代——全新的架構(gòu)定義,全新的軟件界面,硬件加速。我們錯過了PC時代,但云這個時代大家起步是一樣的?,F(xiàn)在是重新定義云的窗口期,如果我們定義好了,中國就可以在下一個技術(shù)時代有自己的一席之地。”張建鋒表示。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。