作者|周雅
如果不是在今年這屆WAIC2023(世界人工智能大會(huì))的現(xiàn)場(chǎng),你很難一次性看到這么多大模型扎堆。據(jù)悉此次參展的大模型多達(dá)30余個(gè),僅被拿來(lái)對(duì)標(biāo)“ChatGPT”的國(guó)產(chǎn)大語(yǔ)言模型,就包括:
清華大學(xué)計(jì)算機(jī)系知識(shí)工程實(shí)驗(yàn)室的千億參數(shù)中英文對(duì)話(huà)模型ChatGLM-130B、復(fù)旦大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室的MOSS、百度“文心一言”、阿里巴巴“通義千問(wèn)”、科大訊飛星火認(rèn)知大模型、商湯商量中文語(yǔ)言大模型、云知聲山海大模型等之多。當(dāng)然,這些也還只是冰山一角,據(jù)不完全統(tǒng)計(jì)來(lái)看,國(guó)內(nèi)大模型用“群模大戰(zhàn)”來(lái)形容也毫不夸張。
國(guó)產(chǎn)大模型的頃刻爆發(fā),也導(dǎo)致算力的需求前所未有,增長(zhǎng)曲線(xiàn)陡峭。有數(shù)據(jù)專(zhuān)門(mén)統(tǒng)計(jì)過(guò),深度學(xué)習(xí)出現(xiàn)之前,用于AI訓(xùn)練的算力增長(zhǎng)大約每20個(gè)月翻一番;之后,用于AI訓(xùn)練的算力大約每6個(gè)月翻一番;2012年后,全球頭部AI模型訓(xùn)練算力需求更是加速到每3個(gè)月至4個(gè)月翻一番,即平均每年算力增長(zhǎng)幅度達(dá)到驚人的10倍;目前大模型發(fā)展如火如荼,訓(xùn)練算力需求有望擴(kuò)張到原來(lái)的10到100倍。
“過(guò)去兩年內(nèi),大模型帶來(lái)了750倍的算力需求增長(zhǎng),而硬件的算力供給增長(zhǎng)僅有3倍。”華為昇騰計(jì)算業(yè)務(wù)總裁張迪煊在采訪(fǎng)中,道出大模型增長(zhǎng)與算力供給之間的不平衡現(xiàn)狀。換言之,其中存在超過(guò)兩百倍的算力缺口。
甚至,中國(guó)工程院院士、鵬城實(shí)驗(yàn)室主任高文在WAIC2023期間指出,“算力也是數(shù)字經(jīng)濟(jì)發(fā)展的一個(gè)指數(shù),算力夠,數(shù)字經(jīng)濟(jì)就能發(fā)展好;反之,就發(fā)展不好。”他還援引清華大學(xué)的一份2022年咨詢(xún)報(bào)告佐證觀(guān)點(diǎn),“算力指數(shù)和GDP成正比,算力越強(qiáng),GDP就越強(qiáng)。”
這意味著,如果按照先前機(jī)構(gòu)預(yù)測(cè)的“AIGC到2030年將創(chuàng)造一個(gè)萬(wàn)億級(jí)的市場(chǎng)規(guī)模”,那么對(duì)于國(guó)產(chǎn)大模型來(lái)說(shuō),眼下最關(guān)鍵是找到高可靠性、高性?xún)r(jià)比的算力。
一個(gè)龐大的萬(wàn)卡“算力工廠(chǎng)”
眾所周知,訓(xùn)練AI算法需要用到大量GPU算力資源,那么大模型時(shí)代下,如何才能把可用的算力資源,變成好用的算力資源?
業(yè)內(nèi)一個(gè)行之有效的方案是,既然單個(gè)服務(wù)器難以滿(mǎn)足計(jì)算需求,那么為何不集中火力辦大事,可以將多個(gè)服務(wù)器連接成一臺(tái)“超級(jí)計(jì)算機(jī)”,而這臺(tái)超級(jí)計(jì)算機(jī),就是算力集群。
以華為舉例。2018年,華為對(duì)外發(fā)布AI戰(zhàn)略,開(kāi)始打造昇騰AI技術(shù)軟件平臺(tái)。時(shí)至今日,華為把昇騰AI打造成了一個(gè)算力集群,它集結(jié)了華為云、計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、能源的綜合優(yōu)勢(shì)。華為的理念是“DC as a Computer”,相當(dāng)于把AI算力中心當(dāng)成一臺(tái)超級(jí)計(jì)算機(jī)來(lái)設(shè)計(jì)。
2019年,華為發(fā)布Atlas 900 AI訓(xùn)練集群,由數(shù)千顆華為自研的昇騰910 AI芯片構(gòu)成,從今年6月可支持4000張卡,到目前已經(jīng)可支持8000張卡。而華為在WAIC期間宣布計(jì)劃,到今年底或明年初做到16000張卡,成為業(yè)界首個(gè)萬(wàn)卡的AI集群。
為何打造算力集群?
張迪煊在采訪(fǎng)中解釋說(shuō),過(guò)去的小模型,每個(gè)場(chǎng)景是定制化的,導(dǎo)致開(kāi)發(fā)成本高、變現(xiàn)能力差;大模型出現(xiàn)后,模型的泛化性越來(lái)越好、能力越來(lái)越強(qiáng)、可以很好去賦能各行業(yè)。“我們?cè)谀菚r(shí)候判斷,AI若要發(fā)展,必然要走向大模型+大算力+大數(shù)據(jù)的計(jì)算方式。”所以,昇騰AI迭代到萬(wàn)卡集群,目的是讓大模型訓(xùn)練越來(lái)越快。
萬(wàn)卡集群相當(dāng)于什么概念?以1750億參數(shù)量的GPT-3模型訓(xùn)練為例,使用單張英偉達(dá)V100顯卡,訓(xùn)練時(shí)長(zhǎng)預(yù)計(jì)要288年;8張V100顯卡的訓(xùn)練時(shí)長(zhǎng)預(yù)計(jì)要36年;512張V100的訓(xùn)練時(shí)長(zhǎng)接近7個(gè)月;而1024張A100的訓(xùn)練時(shí)長(zhǎng),可以減少到1個(gè)月。
按照華為的評(píng)估,訓(xùn)練一個(gè)1750億參數(shù)、100B數(shù)據(jù)的GPT-3模型,在8000張卡的Atlas 900 AI集群下需要耗時(shí)1天,在16000張卡的集群下可以縮短到半天完成訓(xùn)練。“就像寫(xiě)代碼一樣,敲一個(gè)鍵盤(pán),這些文件就出來(lái)了。”張迪煊形容道。
“中國(guó)有一半左右的大模型創(chuàng)新,目前都是由昇騰AI來(lái)支持的。”華為輪值董事長(zhǎng)胡厚崑在WAIC2023期間強(qiáng)調(diào),“昇騰AI集群目前可以提升10%以上的大模型訓(xùn)練效率,提高10倍以上的系統(tǒng)穩(wěn)定性,支持30天不中斷的長(zhǎng)期穩(wěn)定訓(xùn)練。”
胡厚崑還公布了昇騰AI過(guò)去一年來(lái)的成績(jī)單:開(kāi)發(fā)者數(shù)量從90萬(wàn)到180多萬(wàn),實(shí)現(xiàn)了翻倍;原生孵化和適配30多個(gè)10億以上的大模型,占國(guó)產(chǎn)大模型的一半;目前已發(fā)展30多家硬件伙伴、1200多家ISV(獨(dú)立軟件開(kāi)發(fā)商)、聯(lián)合推出2500多個(gè)行業(yè)AI解決方案;此外,昇騰AI集群已支撐全國(guó)25個(gè)城市的人工智能計(jì)算中心建設(shè),其中7個(gè)城市公共算力平臺(tái)入選首批國(guó)家“新一代人工智能公共算力開(kāi)放創(chuàng)新平臺(tái)”,算力規(guī)模占比90%;同時(shí),已有23家企業(yè)推出昇騰AI系列新品,覆蓋云、邊、端智能硬件,一同提升大模型開(kāi)發(fā)、訓(xùn)練、微調(diào)、部署的效率。
這里我們梳理一下,面向AI這片前景廣闊的機(jī)遇之海,華為主要走了三條路徑:
其一,算力領(lǐng)域,從單點(diǎn)算力到集群算力,打造強(qiáng)有力的算力底座。這部分主要基于昇騰AI。
其二,產(chǎn)業(yè)領(lǐng)域,堅(jiān)持開(kāi)源開(kāi)放,來(lái)做強(qiáng)昇騰人工智能產(chǎn)業(yè)生態(tài)。這部分主打的就是政、產(chǎn)、學(xué)、研、用的合作。
其三,生態(tài)領(lǐng)域,推動(dòng)昇騰AI服務(wù)從通用大模型到行業(yè)大模型,推動(dòng)AI“走深向?qū)?rdquo;。這部分目標(biāo)是千行百業(yè)。
大模型落到實(shí)處
與華為的三條AI發(fā)展路徑相對(duì)應(yīng)的,是公眾圍繞“大模型”的關(guān)注度變化,從早期的“是什么”“為什么”轉(zhuǎn)而開(kāi)始關(guān)心“怎么用”,換句話(huà)說(shuō),此刻更多人開(kāi)始關(guān)心“大模型真正能發(fā)揮作用的場(chǎng)景在哪里”。
這時(shí)候,一個(gè)相對(duì)細(xì)分的行業(yè)大模型就被注意到了。
“東方·翼風(fēng)”,是由中國(guó)商飛上海飛機(jī)設(shè)計(jì)研究院開(kāi)發(fā)的三維超臨界機(jī)翼流體仿真大模型,能高精度模擬大飛機(jī)全場(chǎng)景飛行狀況,而且用時(shí)僅為原來(lái)的千分之一,相當(dāng)于將大飛機(jī)三維翼型設(shè)計(jì)速度提升1000倍,縮短了商用大飛機(jī)的研發(fā)周期。
要知道,一架飛機(jī)在飛行過(guò)程中50%的阻力來(lái)自于翅膀,所以如何造出一個(gè)滿(mǎn)足飛機(jī)飛行要求的機(jī)翼,是非常重要的。根據(jù)中國(guó)商用飛機(jī)有限責(zé)任公司科技委常委、遠(yuǎn)程寬體客機(jī)總設(shè)計(jì)師陳迎春的介紹,目前大型客機(jī)的設(shè)計(jì)主要采用三種手段:數(shù)值仿真模擬、風(fēng)洞實(shí)驗(yàn)和飛行實(shí)驗(yàn),這三種互為補(bǔ)充。
但其中「數(shù)值仿真模擬」耗時(shí)長(zhǎng)、成本高,是飛機(jī)設(shè)計(jì)的一大瓶頸;而「飛行實(shí)驗(yàn)」和「風(fēng)洞實(shí)驗(yàn)」也很費(fèi)錢(qián),所以傳統(tǒng)的數(shù)值模擬方法算不動(dòng)、算不快。要解決這個(gè)問(wèn)題,唯有用到AI技術(shù)。
“東方·翼風(fēng)”大模型因?yàn)橛蠥I的加持,實(shí)現(xiàn)了效率、精度、模型、場(chǎng)景四個(gè)層面的突破:第一,在效率方面,用AI模型代替?zhèn)鹘y(tǒng)Navier-Stokes方程求解,大幅提升了全局仿真效率。第二,在精度方面,對(duì)流動(dòng)劇烈變化區(qū)域特征進(jìn)行精細(xì)捕捉,比如在飛機(jī)巡航階段的機(jī)波現(xiàn)象,提升了模型的預(yù)測(cè)精度。第三,在模型方面,建立大數(shù)據(jù)樣本下模型組件化與分布式并行能力,大幅提升了新模型研發(fā)效率。第四,在場(chǎng)景方面,建立了流體到AI的數(shù)據(jù)統(tǒng)一映射,適用汽車(chē)、高鐵等多種仿真場(chǎng)景。
如果進(jìn)一步剖析商飛的“東方·翼風(fēng)”大模型,它有兩個(gè)必備條件:其一,大模型的技術(shù)底座,這部分來(lái)自華為的昇騰AI;其二,流體領(lǐng)域的設(shè)計(jì)思路、專(zhuān)家經(jīng)驗(yàn)、行業(yè)數(shù)據(jù),這部分是商飛的范疇。
從這里可見(jiàn)大模型的發(fā)展邏輯:當(dāng)技術(shù)的觸角深入應(yīng)用到各個(gè)行業(yè)場(chǎng)景里,帶來(lái)整個(gè)商業(yè)系統(tǒng)的健康運(yùn)轉(zhuǎn),進(jìn)而帶動(dòng)產(chǎn)業(yè)高質(zhì)量發(fā)展。在這個(gè)過(guò)程中,技術(shù)廠(chǎng)商和行業(yè)廠(chǎng)商各司其職、互補(bǔ)共生。
“整個(gè)產(chǎn)業(yè)是有分工的,昇騰主要是做好算力,不會(huì)去碰大模型。”張迪煊在采訪(fǎng)中也強(qiáng)調(diào)。
如何打通 “最后一公里”?
談及爆發(fā)式增長(zhǎng)的大模型,張迪煊坦言,如今雖是“百模大戰(zhàn)”,但未來(lái)重點(diǎn)卻應(yīng)該是各有分工。
其中,L0通用大模型只有一部分大廠(chǎng)能“燒”得起,更多企業(yè)做的是L1行業(yè)大模型,還有一部分在做場(chǎng)景大模型。比如金融行業(yè),由于L0缺乏行業(yè)屬性,因此一些企業(yè)會(huì)拿L1的模型去做金融大模型,然后結(jié)合一些細(xì)分場(chǎng)景需要(比如精準(zhǔn)營(yíng)銷(xiāo)的、風(fēng)險(xiǎn)風(fēng)控的、智能客服的)再去做一個(gè)場(chǎng)景大模型。這是一個(gè)產(chǎn)業(yè)趨勢(shì)。
在張迪煊看來(lái),大模型的商業(yè)競(jìng)爭(zhēng)即將開(kāi)啟,大家一方面會(huì)快速造模型,另一方面會(huì)快速搶占格局,但之后形勢(shì)會(huì)有所收斂。
當(dāng)有了大算力、大模型,如何打通行業(yè)落地最后一公里?
目前,整個(gè)行業(yè)的痛點(diǎn)是大模型研發(fā)周期長(zhǎng)、部署門(mén)檻高、業(yè)務(wù)安全性等。為了解決這個(gè)難題,華為與面壁智能、智譜AI、科大訊飛、云從科技四家伙伴共同發(fā)布大模型訓(xùn)推一體化解決方案,通過(guò)共同設(shè)計(jì)、聯(lián)合開(kāi)發(fā)、協(xié)同上市、持續(xù)迭代,為行業(yè)客戶(hù)提供“開(kāi)箱即用”的大模型一體化解決方案。
“客戶(hù)只需選擇合適的大模型,輸入行業(yè)數(shù)據(jù),即可以完成大模型的訓(xùn)練、微調(diào)、推理的全流程。”張迪煊指出,“華為做到了在精度小于千分之五的范圍內(nèi),實(shí)現(xiàn)20倍以上的模型壓縮,幫助大模型壓縮后用到場(chǎng)景中,降低部署難度和開(kāi)發(fā)成本。”
“昇騰AI支持了中國(guó)近一半的原創(chuàng)大模型,也是目前國(guó)內(nèi)唯一完成千億參數(shù)大模型訓(xùn)練并商用的系統(tǒng)。”,張迪煊最后看似輕松的給出這樣一組數(shù)字。
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開(kāi)發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺(jué)解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺(jué)語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺(jué)信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。