亞馬遜云科技在2023 re:Invent全球大會上宣布,亞馬遜云科技與英偉達(dá)宣布擴(kuò)大戰(zhàn)略合作,將聯(lián)合推出先進(jìn)的基礎(chǔ)設(shè)施、軟件及服務(wù),推動客戶在生成式AI(Generative AI)的創(chuàng)新。
雙方將英偉達(dá)與亞馬遜云科技技術(shù)優(yōu)勢相結(jié)合,為訓(xùn)練基礎(chǔ)模型和構(gòu)建生成式AI應(yīng)用提供理想環(huán)境,具體包含英偉達(dá)新一代GPU、CPU與AI軟件的最新多節(jié)點(diǎn)系統(tǒng),以及亞馬遜云科技的Nitro System先進(jìn)虛擬化與安全平臺、Elastic Fabric Adapter(EFA)互連技術(shù)和UltraCluster擴(kuò)展能力。
亞馬遜云科技與英偉達(dá)一直保持長期合作關(guān)系,攜手為生成式AI賦能。此次擴(kuò)大合作將為機(jī)器學(xué)習(xí)(ML)開拓者提供推動這些技術(shù)進(jìn)一步發(fā)展所需的計(jì)算性能。雙方合作的內(nèi)容包括:
1、亞馬遜云科技推出首款結(jié)合NVIDIA Grace Hopper Superchip與Amazon UltraCluster擴(kuò)展功能的云AI超級計(jì)算機(jī)。
2、NVIDIA DGX Cloud率先配備NVIDIA GH200 NVL32,并首次在亞馬遜云科技上提供此AI訓(xùn)練即服務(wù)。
3、英偉達(dá)和亞馬遜云科技在Project Ceiba上合作,打造全球最快的GPU驅(qū)動AI超級計(jì)算機(jī)以及最新的NVIDIA DGX Cloud超級計(jì)算機(jī),用于英偉達(dá)的AI研發(fā)以及自研模型開發(fā)服務(wù)。
4、配置NVIDIA GH200、H200、L40S以及L4 GPU等芯片的全新Amazon EC2實(shí)例,大幅提升生成式AI、HPC高性能計(jì)算、設(shè)計(jì)以及模擬類工作負(fù)載的性能。
5、在亞馬遜科技上運(yùn)行的英偉達(dá)軟件,包括NeMo LLM框架、NeMo Retriever以及BioNeMo,加速自研模型、語義檢索、新藥研發(fā)等應(yīng)用的生成式AI發(fā)展。
此次雙方合作將大幅加速所有產(chǎn)業(yè)應(yīng)用生成式AI的發(fā)展,具體內(nèi)容包括:
1、亞馬遜云科技是第一家在云端配備具有多節(jié)點(diǎn)NVLink技術(shù)的NVIDIA GH200 Grace Hopper Superchips的云廠商。NVIDIA GH200 NVL32多節(jié)點(diǎn)平臺運(yùn)用NVIDIA NVLink與NVSwitch技術(shù)連接32個(gè)Grace Hopper Superchips,組成一個(gè)實(shí)例。此平臺將在Amazon Elastic Compute Cloud(Amazon EC2)實(shí)例上可用,與亞馬遜強(qiáng)大的網(wǎng)絡(luò)(EFA)相連,由先進(jìn)的虛擬化(Amazon Nitro System)及超大規(guī)模集群(Amazon EC2 UltraClusters)提供支持,讓共同客戶能擴(kuò)展至數(shù)千個(gè)GH200 Superchips。
2、英偉達(dá)與亞馬遜云科技將連手在亞馬遜云科技上推出NVIDIA DGX Cloud NVIDIA AI訓(xùn)練即服務(wù)(AI-training-as-a-service)。此服務(wù)將是首個(gè)配置GH200 NVL32的DGX Cloud,為開發(fā)者提供單一實(shí)例中最多的共享內(nèi)存。在亞馬遜云科技上運(yùn)行的DGX Cloud將加速訓(xùn)練含有超過1兆參數(shù)的尖端生成式AI與大型語言模型。
3、英偉達(dá)與亞馬遜云科技合作推動Project Ceiba,構(gòu)建全球最快的GPU驅(qū)動的AI超級計(jì)算機(jī),這是一個(gè)配備GH200 NVL32與Amazon EFA互連技術(shù)的大規(guī)模系統(tǒng),該系統(tǒng)部署在亞馬遜云科技上,為英偉達(dá)研發(fā)團(tuán)隊(duì)提供服務(wù)。該開創(chuàng)先河的超級計(jì)算機(jī)配置16,384顆NVIDIA GH200 Superchips,能處理65 exaflops速度等級的AI運(yùn)算,英偉達(dá)使用該超級計(jì)算機(jī)推動其全新生成式AI的創(chuàng)新。
4、亞馬遜云科技將推出三款A(yù)mazon EC2實(shí)例:P5e實(shí)例配置NVIDIA H200 Tensor Core GPUs,針對大規(guī)模與尖端生成式AI及HPC高性能運(yùn)算工作負(fù)載;分別配置NVIDIA L4 GPUs與NVIDIA L40S GPUs的G6 與G6e實(shí)例,可運(yùn)行包括AI微調(diào)、推理、繪圖以及影片工作負(fù)載等廣泛應(yīng)用。G6e實(shí)例特別適用于開發(fā)3D工作流程、數(shù)字孿生、以及其他使用NVIDIA Omniverse的應(yīng)用,用來連結(jié)與構(gòu)建各種生成式AI的3D應(yīng)用。
亞馬遜云科技首席執(zhí)行官Adam Selipsky表示:“亞馬遜云科技與英偉達(dá)合作已經(jīng)超過13年,我們的合作起源于推出全球首個(gè)配置GPU的云端實(shí)例?,F(xiàn)在我們推出最廣泛的英偉達(dá) GPU解決方案,可用于各種工作負(fù)載,包括繪圖、游戲、HPC高性能計(jì)算、機(jī)器學(xué)習(xí),直到現(xiàn)在的生成式AI。我們持續(xù)運(yùn)用英偉達(dá)技術(shù)推動創(chuàng)新,并通過將新一代NVIDIA Grace HopperSuperchips與亞馬遜云科技強(qiáng)大看的網(wǎng)絡(luò)EFA、超大規(guī)模集群EC2 UltraClusters以及先進(jìn)虛擬化能力Nitro相結(jié)合,讓亞馬遜云科技成為運(yùn)行GPU的最佳云端環(huán)境。”
英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“生成式AI正改變各種云端負(fù)載,為多元內(nèi)容創(chuàng)作在底層注入加速計(jì)算動能。我們共同目標(biāo)是為每個(gè)客戶提供具有成本效益、先進(jìn)生成式AI,為此英偉達(dá)與亞馬遜云科技在整個(gè)計(jì)算堆棧展開合作,橫跨AI基礎(chǔ)設(shè)施、加速庫(acceleration libraries)、基礎(chǔ)模型以及生成式AI服務(wù)。”
在亞馬遜云科技云端上運(yùn)行英偉達(dá)軟件,加速生成式AI的研發(fā)
此外,英偉達(dá)宣布推出在亞馬遜云科技上運(yùn)行的軟件,用于加速其生成式AI的研發(fā)。NVIDIA NeMo Retriever microservice微服務(wù)提供多項(xiàng)新工具,用來創(chuàng)造高精準(zhǔn)度的聊天機(jī)器人,以及運(yùn)用加速的語意檢索技術(shù)的歸納工具。在Amazon SageMaker上可用的NVIDIA BioNeMo,并計(jì)劃在亞馬遜云科技托管的NVIDIA DGX Cloud,讓制藥企業(yè)加快新藥開發(fā),企業(yè)可運(yùn)用自己的數(shù)據(jù)簡化與加速模型訓(xùn)練。
在亞馬遜云科技云端運(yùn)行的英偉達(dá)軟件將幫助亞馬遜為其服務(wù)與運(yùn)營注入創(chuàng)新動能。亞馬遜云科技正運(yùn)用NVIDIA NeMo框架訓(xùn)練新一代大語言模型Amazon Titan。Amazon Robotics也已開始借助NVIDIA Omniverse Isaac打造數(shù)字孿生,在虛擬化環(huán)境中推動自主倉庫的自動化、優(yōu)化以及規(guī)劃,完成之后再部署到真實(shí)環(huán)境。
好文章,需要你的鼓勵
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動質(zhì)量,在多項(xiàng)測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。