4月23日,2014年ASC世界大學(xué)生超級計算機競賽(以下簡稱ASC14)首輪HPL比賽即創(chuàng)出驚人佳績,中山大學(xué)、華中科技大學(xué)和臺灣清華大學(xué)三支高校代表隊全部打破世界紀(jì)錄。其中,東道主中山大學(xué)在3000W功耗約束下實現(xiàn)每秒9.272萬億次浮點運算性能,提前鎖定本屆大賽的最高計算性能獎。
ASC14由亞洲超算協(xié)會、中山大學(xué)和浪潮集團共同主辦,是亞洲發(fā)起的世界最大規(guī)模的大學(xué)生超算競賽,全球化、高水平、中國特色是本屆大賽的三大特點。該項賽事旨在通過大賽平臺推動各國及地區(qū)間超算青年人才交流和培養(yǎng),提升超算應(yīng)用水平和研發(fā)能力,發(fā)揮超算的科技驅(qū)動力,促進科技與產(chǎn)業(yè)創(chuàng)新。ASC14自2013年11月啟動,共有來自全球五大洲的82所高校代表隊報名參賽。經(jīng)過激烈的預(yù)賽比拼,最終有16支高校隊伍入圍4月21日-25日在中山大學(xué)舉行的總決賽。
據(jù)了解,ASC14的HPL測試有嚴(yán)格的比賽規(guī)定,要求各參賽隊伍在總功耗3000W的限制下,采用組委會提供的浪潮超算節(jié)點、高速網(wǎng)絡(luò)等設(shè)備,完成超算系統(tǒng)的搭建。中山大學(xué)最終完成的超算系統(tǒng)采用了混合異構(gòu)加速技術(shù),共使用216個處理器核心的浪潮超算服務(wù)器和8塊異構(gòu)加速卡。經(jīng)過國際通行的HPL測試,最終該系統(tǒng)的持續(xù)浮點運算能力達到9.272萬億次/秒。此前,該項世界紀(jì)錄為8.45萬億次/秒,由華中科技大學(xué)在2013年6月于德國舉行的ISC13超算競賽中創(chuàng)造。
對于提前鎖定本屆大賽的最高計算性能獎,中山大學(xué)代表隊指導(dǎo)老師葉緯表示,中山大學(xué)之所以能取得這一成績,一方面在于團隊針對HPL應(yīng)用進行了大量深入細致的策略性優(yōu)化,充分發(fā)揮了混合異構(gòu)加速技術(shù)優(yōu)勢,大幅提升了系統(tǒng)浮點運算能力;另一方面主辦方為各參賽隊伍提供了可視化的高性能計算服務(wù)平臺Cluster Engine,可以實時監(jiān)控系統(tǒng)運行狀態(tài),幫助團隊分析優(yōu)化運行功耗,在發(fā)揮運算性能同時又能有效控制功耗在3000W以內(nèi)。他認為,HPL只代表了系統(tǒng)的理論計算性能,接下來的實際應(yīng)用優(yōu)化比試環(huán)節(jié)將是更大的挑戰(zhàn)。
在稍晚召開的小型新聞發(fā)布會上,ASC競賽組委會委員、浪潮集團高性能計算總經(jīng)理劉軍表示,三隊同破世界紀(jì)錄讓人感到驚訝和欣喜,這說明ASC參賽大學(xué)生對超算新技術(shù)的理解、對超算架構(gòu)的創(chuàng)新思維,都已經(jīng)遠超往屆,很好的體現(xiàn)出大賽水平高的特點。同時,這也表明ASC大賽在推動超算人才培養(yǎng)方面,已經(jīng)確確實實的發(fā)揮出巨大的作用。劉軍介紹說,接下來各參賽隊還將應(yīng)對天河二號應(yīng)用擴展極限挑戰(zhàn),更加值得期待。
據(jù)介紹,ASC超算競賽已連續(xù)舉辦三屆,從2012年的27所,到2013年的43所,再到2014年的全球82所高校參賽,完成了從中國到亞洲,從亞洲到世界的“三級跳”發(fā)展。大賽舉辦三年來,已經(jīng)激發(fā)起社會各界對超算應(yīng)用發(fā)展的關(guān)注,吸引更多人才投身于超算事業(yè),對于超算產(chǎn)業(yè)的發(fā)展產(chǎn)生深遠影響。
中山大學(xué)數(shù)學(xué)與計算科學(xué)學(xué)院許躍生教授表示,要發(fā)揮超級計算機在解決人類重大科學(xué)工程問題上的推動作用,不僅需要高性能的硬件系統(tǒng),更需要能真正發(fā)揮出系統(tǒng)性能的應(yīng)用軟件,而要實現(xiàn)這一目標(biāo),核心在于超算復(fù)合型人才的培養(yǎng)。ASC大賽對超算應(yīng)用創(chuàng)新的鼓勵,將加速我國超算人才的培養(yǎng)進程。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。