7月7日,燧原科技在上海發(fā)布一系列新品,包括第二代人工智能訓(xùn)練產(chǎn)品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”訓(xùn)練加速卡和“云燧T21”訓(xùn)練OAM模組,全面升級(jí)的“馭算TopsRider”軟件平臺(tái)以及全新的“云燧集群”,成為國(guó)內(nèi)首家發(fā)布第二代人工智能訓(xùn)練產(chǎn)品組合的公司。
燧原科技第二代通用人工智能訓(xùn)練芯片“邃思2.0”
從2018年3月成立,到2019年12月推出第一款云端訓(xùn)練芯片“邃思”和第一代訓(xùn)練加速卡“云燧T10”,再到如今的“邃思2.0”和“云燧T20”——燧原科技完成對(duì)AI訓(xùn)練芯片的二次迭代,僅用了三年時(shí)間。
“路雖遠(yuǎn)行則將至,事雖難不做不成”,燧原科技CEO趙立東在現(xiàn)場(chǎng),用這14個(gè)字總結(jié)心路歷程。在他看來(lái),這是一個(gè)AI算力爆炸的時(shí)代,過(guò)去五年,每3.5個(gè)月,AI算力加倍,換算成一年就是10倍,而目前AI算力生態(tài)鏈被壟斷。而燧原希望與合作伙伴打破這種壟斷,構(gòu)建一個(gè)沒(méi)有依賴的自主生態(tài)。
究竟如何做生態(tài)?燧原提出“燎原”計(jì)劃,以人工智能為起點(diǎn),構(gòu)建通用異構(gòu)計(jì)算生態(tài),構(gòu)建標(biāo)準(zhǔn)化的技術(shù)體系,共建完整的開發(fā)者生態(tài)、產(chǎn)業(yè)生態(tài)、科研生態(tài),服務(wù)數(shù)字中國(guó)。該計(jì)劃有三個(gè)特征:原始創(chuàng)新、標(biāo)準(zhǔn)化、開放姿態(tài)共建生態(tài)。
“第二代人工智能訓(xùn)練產(chǎn)品的發(fā)布,是燧原科技開發(fā)原始創(chuàng)新的算力產(chǎn)品和構(gòu)建自主生態(tài)又一重要的里程碑。通過(guò)芯片架構(gòu)和軟件平臺(tái)的升級(jí)迭代,提升產(chǎn)品競(jìng)爭(zhēng)力,滿足市場(chǎng)需求,從而加速產(chǎn)品商業(yè)化的步伐。”趙立東指出,“在復(fù)雜的國(guó)際大環(huán)境下,原始創(chuàng)新和自主生態(tài)成為發(fā)展趨勢(shì),這也是燧原科技自創(chuàng)立以來(lái)始終堅(jiān)持的戰(zhàn)略選擇,是支撐技術(shù)和業(yè)務(wù)長(zhǎng)遠(yuǎn)發(fā)展,不斷拉近與世界先進(jìn)水平的距離,并在市場(chǎng)競(jìng)爭(zhēng)中取得主動(dòng)的基礎(chǔ)。面向泛互聯(lián)網(wǎng)、傳統(tǒng)行業(yè)(金融、交通、電力、醫(yī)療、工業(yè)等)以及新基建三大業(yè)務(wù)方向,燧原科技正以全新、更具競(jìng)爭(zhēng)力的產(chǎn)品,服務(wù)市場(chǎng)和客戶。”
談到新產(chǎn)品,燧原科技COO張亞林現(xiàn)場(chǎng)介紹:“邃思2.0大幅提升了算力指標(biāo),升級(jí)后的馭算軟件平臺(tái)更加便捷易用和客戶友好,燧原科技也可針對(duì)客戶的場(chǎng)景和業(yè)務(wù)模型提供軟件定制化服務(wù)和優(yōu)化,打造差異化解決方案。此外,基于云燧T20和T21訓(xùn)練產(chǎn)品、GCU-LARE互聯(lián)技術(shù)和新一代馭算,燧原科技可以打造超大規(guī)模的集群產(chǎn)品CloudBlazer Matrix,有效降低人工智能超算集群的整體復(fù)雜度和成本,同時(shí)通過(guò)與合作伙伴的聯(lián)合開發(fā),一起構(gòu)建超大規(guī)模的液冷智能數(shù)據(jù)中心,以響應(yīng)國(guó)家‘低碳算力’和‘綠色一體化智能計(jì)算’的戰(zhàn)略方向。”
燧原科技CEO趙立東(左)與 燧原科技COO張亞林(右)共同發(fā)布“云燧T20”訓(xùn)練加速卡和“邃思2.0”芯片
據(jù)悉,邃思2.0的計(jì)算能力、存儲(chǔ)和帶寬、互聯(lián)能力較第一代訓(xùn)練產(chǎn)品有巨大提升,對(duì)超大規(guī)模的模型支持能力獲得顯著增強(qiáng)。而同步升級(jí)的馭算TopsRider軟件平臺(tái),成為燧原科技構(gòu)建原始創(chuàng)新軟件生態(tài)的基石。完全自研的軟硬件架構(gòu),助力燧原科技在知識(shí)產(chǎn)權(quán)和產(chǎn)品升級(jí)迭代上可以自主掌控方向和節(jié)奏。
燧原科技第二代通用人工智能訓(xùn)練加速卡“云燧T20”
燧原科技第二代通用人工智能訓(xùn)練模組“云燧T21”
四大核心升級(jí) 打造全新產(chǎn)品矩陣與智算集群
架構(gòu)升級(jí)實(shí)現(xiàn)算力飛躍:邃思2.0進(jìn)行了大規(guī)模的架構(gòu)升級(jí),新一代全自研的GCU-CARA全域計(jì)算架構(gòu),針對(duì)人工智能計(jì)算的特性進(jìn)行深度優(yōu)化,夯實(shí)了支持通用異構(gòu)計(jì)算的基礎(chǔ);支持全面的計(jì)算精度,涵蓋從FP32、TF32、FP16、BF16到INT8,并成為中國(guó)首款支持單精度張量TF32數(shù)據(jù)精度的人工智能芯片。單精度FP32峰值算力達(dá)到40 TFLOPS,單精度張量TF32峰值算力達(dá)到160 TFLOPS,均為國(guó)內(nèi)第一。
HBM2E存儲(chǔ)帶來(lái)海量吞吐:邃思2.0共搭載了4顆HBM2E片上存儲(chǔ)芯片,高配支持64 GB內(nèi)存,帶寬達(dá)1.8 TB/s,是中國(guó)第一個(gè)支持世界最先進(jìn)存儲(chǔ)HBM2E和單芯片64 GB內(nèi)存的產(chǎn)品。
高速互聯(lián)支撐算力擴(kuò)展:GCU-LARE全域互聯(lián)技術(shù)是燧原專為人工智能訓(xùn)練集群研發(fā)的互聯(lián)技術(shù),提供雙向300 GB/s互聯(lián)帶寬,支持?jǐn)?shù)千張?jiān)旗軨loudBlazer加速卡互聯(lián),實(shí)現(xiàn)優(yōu)異的線性加速比。
全新軟件駕馭澎湃算力:馭算TopsRider是燧原科技自主知識(shí)產(chǎn)權(quán)的計(jì)算及編程平臺(tái),通過(guò)軟硬件協(xié)同架構(gòu)設(shè)計(jì),充分發(fā)揮邃思2.0的性能;基于算子泛化技術(shù)及圖優(yōu)化策略,支持主流深度學(xué)習(xí)框架下的各類模型訓(xùn)練;利用Horovod分布式訓(xùn)練框架與GCU-LARE互聯(lián)技術(shù)相互配合,為超大規(guī)模集群的高效運(yùn)行提供解決方案。開放升級(jí)的編程模型和可擴(kuò)展的算子接口,為客戶模型的優(yōu)化提供了自定義的開發(fā)能力。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。