作者 | 金旺
來(lái)源 | 科技行者
2024年12月2日,亞馬遜云科技一年一度的re:Invent大會(huì)在美國(guó)拉斯維加斯召開(kāi)。
作為亞馬遜云科技年度盛會(huì),2024 re:Invent大會(huì)現(xiàn)場(chǎng)吸引了6萬(wàn)人參會(huì),40萬(wàn)人線上觀看。
大會(huì)期間,至頂科技也在現(xiàn)場(chǎng)目睹了這場(chǎng)盛會(huì)的人潮洶涌,以及來(lái)自亞馬遜云科技的諸多云計(jì)算、人工智能技術(shù)和產(chǎn)品發(fā)布。
我們看到了亞馬遜云科技的新一代計(jì)算實(shí)例、看到了新一代AI芯片,也看到了亞馬遜云科技在生成式AI領(lǐng)域密集的戰(zhàn)略部署。
更讓現(xiàn)場(chǎng)觀眾感到意外的是,蘋果高管——機(jī)器學(xué)習(xí)和AI高級(jí)總監(jiān)Benoit Dupin難得一見(jiàn)地親臨現(xiàn)場(chǎng)為亞馬遜云科技站臺(tái),并透露,其備受關(guān)注的Apple Intelligence,正是基于亞馬遜云科技的服務(wù)。
僅僅是在十幾天后,12月18日,亞馬遜云科技再次將2024 re:Invent大會(huì)帶到了上海,為中國(guó)合作伙伴和開(kāi)發(fā)者帶來(lái)了一個(gè)親臨現(xiàn)場(chǎng)感受亞馬遜云科技新一代技術(shù)和產(chǎn)品的機(jī)會(huì)。
在上海發(fā)布會(huì)現(xiàn)場(chǎng),我們重溫了亞馬遜云科技Amazon EC2 Trn2實(shí)例、Amazon Aurora DSQL、Amazon Graviton4、Amazon Nova等新一代產(chǎn)品的新特性,也與亞馬遜云科技大中華區(qū)解決方案架構(gòu)總經(jīng)理代聞一起聊了聊他們對(duì)當(dāng)下人工智能技術(shù)的理解和布局。
01 自研芯片的亞馬遜云科技,為Anthropic建十萬(wàn)“卡”集群
在過(guò)去十五年里,云計(jì)算技術(shù)的快速演進(jìn)支撐了全球數(shù)字經(jīng)濟(jì)的崛起。
作為云計(jì)算的主要推動(dòng)者之一,亞馬遜云科技的基石產(chǎn)品Amazon EC2的更新,成了每年的一大看點(diǎn)。
Amazon EC2實(shí)例是如何推陳出新的呢?
據(jù)代聞透露,這主要依賴其背后的底層平臺(tái)Amazon Nitro System的持續(xù)迭代。
亞馬遜云科技的Nitro系統(tǒng)自2017年正式對(duì)外發(fā)布以來(lái),已經(jīng)迭代了多個(gè)版本,作為亞馬遜云科技旨在幫助Amazon EC2進(jìn)行硬件卸載、提高網(wǎng)絡(luò)和存儲(chǔ)性能,以及提高虛擬化安全性的技術(shù),如今的Nitro系統(tǒng)已經(jīng)成為亞馬遜云科技軟硬件一體化發(fā)展的重要基礎(chǔ)。
為了推動(dòng)計(jì)算實(shí)例的發(fā)展,亞馬遜云科技團(tuán)隊(duì)將Nitro系統(tǒng)進(jìn)行了解耦,即將完整的虛擬化軟件堆棧部署于獨(dú)立于計(jì)算服務(wù)器的Nitro系統(tǒng)上,讓底層虛擬化平臺(tái)與上層計(jì)算實(shí)例分離。
這樣設(shè)計(jì)的好處是,亞馬遜云科技可以分別推進(jìn)兩部分產(chǎn)品的演進(jìn)——底層硬件吞吐、存儲(chǔ)虛擬化、計(jì)算虛擬化完全在Nitro系統(tǒng)中進(jìn)行,上層可計(jì)算實(shí)例也可以獨(dú)立發(fā)展。
得益于這樣的產(chǎn)品發(fā)展策略,亞馬遜云科技在2020年對(duì)外發(fā)布了Amazon EC2 Mac實(shí)例,實(shí)現(xiàn)了在Amazon EC2上運(yùn)行Mac系統(tǒng)。
在本次發(fā)布會(huì)上,亞馬遜云科技基于Trainium2芯片的Amazon EC2 Trn2實(shí)例正式發(fā)布。
被譽(yù)為個(gè)人計(jì)算機(jī)之父的Alan Kay曾有這樣一句廣為流傳的名言,“真正認(rèn)真對(duì)待軟件的人就應(yīng)該自己做硬件”。這句話后來(lái)被喬布斯在2007年的iPhone發(fā)布會(huì)上所引用。
不可否認(rèn)的是,借助軟硬結(jié)合理念,蘋果在全球取得了巨大的成功,不過(guò),亞馬遜云科技同樣是這一理念的忠實(shí)擁躉。
早在2018年,注意到ARM芯片架構(gòu)的重要性后,亞馬遜云科技開(kāi)始著手自主研發(fā)CPU,在這之后,亞馬遜云科技特別針對(duì)云計(jì)算設(shè)計(jì)優(yōu)化了Neoverse架構(gòu),今年基于這一架構(gòu)的第四代Amazon Graviton4也在今年早些時(shí)候正式對(duì)外發(fā)布。
與此同時(shí),面向人工智能應(yīng)用,亞馬遜還在2019年推出了首款推理芯片Amazon Inferentia,2022年推出了首款訓(xùn)練芯片Amazon Trainium1,2023年官宣了宣布了Amazon Trainium2開(kāi)發(fā)計(jì)劃。
本次亞馬遜云科技發(fā)布的Amazon EC2 Trn2計(jì)算實(shí)例也正是搭載了Amazon Trainium2。
搭載自研的Amazon Trainium2的Amazon EC2 Trn2計(jì)算實(shí)例,是目前亞馬遜云科技推出的最強(qiáng)自研芯片的AI實(shí)例,相較于當(dāng)前基于H100的GPU實(shí)例,Amazon Trainium2的性價(jià)比提升了30%到40%。
值得注意的是,Amazon Trainium2底層硬件工作原理與GPU不同,是以Systolic Array(脈動(dòng)陣列)方式來(lái)運(yùn)行,這顆芯片工作時(shí)會(huì)和HBM(高帶寬內(nèi)存)模塊一起封裝在SoC中。
這其中,以什么樣的計(jì)算單元,又以多少個(gè)HBM模塊、采用怎樣的封裝方式封裝,這些因素決定了單顆芯片的內(nèi)存帶寬和計(jì)算能力。
代聞指出,“我們是面向現(xiàn)在機(jī)器學(xué)習(xí)訓(xùn)練和推理等不同場(chǎng)景,綜合當(dāng)下一些難題,反過(guò)來(lái)思考硬件應(yīng)該如何重構(gòu)、怎樣設(shè)計(jì),進(jìn)而推出了這樣的芯片。所以你會(huì)看到,從Trainium1到Trainium2,再到今年預(yù)發(fā)布的Trainium3,每一次更新都會(huì)逐步解決當(dāng)下遇到的很多難題。”
此外,采用NeuronLink技術(shù)將搭載64個(gè)Amazon Trainium2的實(shí)例相連構(gòu)成的Amazon EC2 Trn2 UltraServers服務(wù)器,單個(gè)計(jì)算節(jié)點(diǎn)峰值計(jì)算性能將超過(guò)83.2 Petaflops,這不僅為超大規(guī)模模型提供了更強(qiáng)的推理性能,而且由此構(gòu)建超大規(guī)模訓(xùn)練集群的過(guò)程也將更加高效。
被視為OpenAI的頭號(hào)對(duì)手的Anthropic正是采用了這一模式。
據(jù)悉,亞馬遜云科技正在與Anthropic合作一個(gè)Project Rainier項(xiàng)目,這一項(xiàng)目旨在為Anthropic構(gòu)建一個(gè)擁有數(shù)十萬(wàn)顆芯片的訓(xùn)練集群,這個(gè)新集群運(yùn)算性能預(yù)計(jì)是目前Anthropic訓(xùn)練Claude的GPU集群的五倍以上。
值得注意的是,人工智能作為當(dāng)下科技領(lǐng)域大勢(shì)所趨,亞馬遜不僅向AI獨(dú)角獸Anthropic先后投資了共計(jì)80億美元,還在今年的re:Invent大會(huì)上發(fā)布了自己的大模型產(chǎn)品,公布了自己的人工智能戰(zhàn)略。
02 讓企業(yè)輕松構(gòu)建AI原生應(yīng)用
自2022年11月ChatGPT面世后,經(jīng)過(guò)兩年的爆炸式發(fā)展,生成式AI已經(jīng)不再是一個(gè)可選項(xiàng),而成了應(yīng)用構(gòu)建不可或缺的核心組件。
在代聞看來(lái),“這次生成式AI與五六年前的人工智能發(fā)展有所不同,我們注意到很多需求其實(shí)是源于業(yè)務(wù)部門。”
對(duì)此,代聞舉了兩個(gè)應(yīng)用案例:
其一是在企業(yè)營(yíng)銷領(lǐng)域,通過(guò)利用生成式AI生成營(yíng)銷文案、圖片海報(bào),極大地加快了整個(gè)營(yíng)銷方案生產(chǎn)流程、降低了營(yíng)銷方案制作復(fù)雜度;
其二是在應(yīng)用開(kāi)發(fā)領(lǐng)域,生成式AI可以自動(dòng)檢測(cè)代碼,大幅簡(jiǎn)化開(kāi)發(fā)人員工作量,提升開(kāi)發(fā)人員工作效率。
當(dāng)在任何設(shè)計(jì)架構(gòu)中都需要考慮如何為應(yīng)用程序賦予生成式AI能力時(shí),面對(duì)應(yīng)用開(kāi)發(fā)者各種各樣的需求,如何選擇模型就成了首先要考慮的問(wèn)題。
代聞指出,“現(xiàn)在大模型各有所長(zhǎng),但沒(méi)有任何一種模型可以解決所有問(wèn)題。”
正是看到了這一趨勢(shì)亞馬遜云科技此次發(fā)布了Amazon Nova系列模型,6個(gè)模型,包括:
快速文本生成模型Amazon Nova Micro,能夠處理文本、圖像和視頻并生成文本的多模態(tài)模型Amazon Nova Lite、Amazon Nova Pro、Amazon Nova Premier,以及用于生成高質(zhì)量圖像的Amazon Nova Canvas和用于生成高質(zhì)量視頻的Amazon Nova Reel。
代聞在接受媒體采訪時(shí)指出:
“如今很多人在進(jìn)行信息檢索、人機(jī)交互、APP使用時(shí),都已經(jīng)開(kāi)始借助大模型來(lái)完成。
這就帶來(lái)了從面向消費(fèi)者(To C)到面向企業(yè)(To B)領(lǐng)域中,對(duì)于整個(gè)應(yīng)用程序的重構(gòu),這種重構(gòu)涉及能否開(kāi)箱即用、開(kāi)發(fā)人員能否更好地利用大模型為自己的應(yīng)用程序賦能,以及底層平臺(tái)能否具備更好的性價(jià)比等問(wèn)題。”
為此,亞馬遜云科技推出了Amazon Q Developer、Amazon Q Business和Amazon Q擴(kuò)展更多應(yīng)用場(chǎng)景,顯著提升了開(kāi)發(fā)效率、簡(jiǎn)化復(fù)雜任務(wù),并為不同行業(yè)和應(yīng)用場(chǎng)景提供可定制的智能解決方案。
以Amazon Q Developer為例,Amazon Q Developer此次推出了能夠?qū)崿F(xiàn)自動(dòng)生成和執(zhí)行單元測(cè)試、自動(dòng)生成精準(zhǔn)文檔、自動(dòng)執(zhí)行代碼審查流程的三款智能體,還推出了新的遷移功能,可以用于將.NET從Windows迅速遷移到Linux、將VMware工作負(fù)載遷移到云原生架構(gòu)、通過(guò)應(yīng)用轉(zhuǎn)化加速大型機(jī)遷移,大幅提升開(kāi)發(fā)人員在整個(gè)軟件開(kāi)發(fā)流程中的效率。
通過(guò)這些AI開(kāi)發(fā)工具,亞馬遜云科技旨在加速生成式AI應(yīng)用開(kāi)發(fā)效率,與此同時(shí),亞馬遜云科技還構(gòu)建了面向開(kāi)發(fā)者的生成式AI服務(wù)平臺(tái)Amazon Bedrock。
Amazon Bedrock自2023年9月發(fā)布后,陸續(xù)上線了多種可選模型,包括LumaAI的Ray2、poolside的malibu和point、Stable Diffusion 3.5,以及本次發(fā)布的Amazon Nova系列模型,新推出的Amazon Bedrock Marketplace更是提供了100+模型可選項(xiàng)。
此外,據(jù)大會(huì)上公布信息顯示,亞馬遜云科技進(jìn)一步就Amazon Bedrock增強(qiáng)了私有數(shù)據(jù)應(yīng)用、AI安全、智能體功能,支持知識(shí)庫(kù)微調(diào)、GraphRAG、結(jié)構(gòu)化數(shù)據(jù)檢索、自動(dòng)推理檢查、多智能體協(xié)作等新功能。
實(shí)際上,生成式AI不僅正在成為應(yīng)用構(gòu)建的核心組件,也在成為云計(jì)算的底層邏輯。
作為云計(jì)算模式的早期應(yīng)用者,也是當(dāng)下全球最大的云計(jì)算服務(wù)供應(yīng)商,亞馬遜云科技深刻體會(huì)到了云計(jì)算正在從云原生轉(zhuǎn)向AI原生。
代聞告訴我們,“從云原生到AI原生已經(jīng)在逐漸發(fā)生,你會(huì)發(fā)現(xiàn),現(xiàn)在沒(méi)有AI不是在云上發(fā)生。”
至于亞馬遜云科技,正在面向AI原生提供構(gòu)建AI的全部技術(shù)棧,包括底層專為AI打造的芯片和服務(wù)器,輕松接入領(lǐng)先模型并擁有各種模型定制工具的Amazon Bedrock,以及頂層開(kāi)箱即用的Amazon Q。
代聞指出,“亞馬遜云科技是要讓各種不同技術(shù)棧的企業(yè),都可以在亞馬遜云科技上輕松構(gòu)建AI原生的應(yīng)用。”
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。
關(guān)注智造、硬件、機(jī)器人。