9月1日,2022世界人工智能大會(huì)在上海開(kāi)幕。峰會(huì)期間,上海白玉蘭開(kāi)源開(kāi)放研究院發(fā)布《中國(guó)人工智能軟件基礎(chǔ)設(shè)施高質(zhì)量發(fā)展報(bào)告》(以下簡(jiǎn)稱《報(bào)告》)。參與調(diào)研的單位包括上海交通大學(xué)人工智能研究院、木蘭開(kāi)源社區(qū)、OpenVINO中文社區(qū)、飛槳社區(qū)、英特爾、阿里云、亞馬遜云科技、騰源會(huì)、微軟Reactor、昇思MindSpore社區(qū)、FATE社區(qū)、BigDL社區(qū)、MagicHub社區(qū)、Ray中文社區(qū)、ModelArts社區(qū)、OpenMLDB社區(qū)、語(yǔ)音之家、希爾貝殼、Zilliz、思賢科技、CSDN、InfoQ、思否、稀土掘金、億歐咨詢、示說(shuō)、GDG上海、極術(shù)社區(qū)、SeaTunnel社區(qū)、DolphinScheduler社區(qū)、Juicedata社區(qū)、開(kāi)放群島開(kāi)源社區(qū)(排名不分先后)等30余家人工智能技術(shù)社區(qū)、數(shù)據(jù)社區(qū)及垂直媒體。
“十四五”規(guī)劃和2035遠(yuǎn)景目標(biāo)提出要以高質(zhì)量發(fā)展為主題,要求人工智能技術(shù)進(jìn)一步加快作用于國(guó)民經(jīng)濟(jì)活動(dòng)。通過(guò)完善數(shù)字化技術(shù)和支持能力,在此之上構(gòu)建智能化商業(yè)模式是數(shù)字化轉(zhuǎn)型的核心目標(biāo),人工智能軟件基礎(chǔ)設(shè)施建設(shè)對(duì)于完成這一目標(biāo)起到重要作用。然而在人工智能技術(shù)落地的問(wèn)題上,存在著諸多障礙,技術(shù)價(jià)值貶值和可行性困難在具體市場(chǎng)和應(yīng)用場(chǎng)景中時(shí)有發(fā)生。針對(duì)這一現(xiàn)實(shí)困境,《報(bào)告》對(duì)當(dāng)前人工智能軟件基礎(chǔ)設(shè)施建設(shè)的現(xiàn)狀與問(wèn)題進(jìn)行了系統(tǒng)梳理,進(jìn)一步提出要從人工智能人才、基礎(chǔ)軟件框架、數(shù)據(jù)治理、工程落地、基礎(chǔ)軟件社區(qū)生態(tài)等不同維度協(xié)同共進(jìn)的發(fā)展思路。
《報(bào)告》近五萬(wàn)字,分五個(gè)章節(jié)從人才、數(shù)據(jù)、算力、工程和運(yùn)營(yíng)等五個(gè)維度進(jìn)行闡述。人才層面,展現(xiàn)我國(guó)人工智能開(kāi)發(fā)者分布現(xiàn)狀及提出人才培養(yǎng)的可行方式。數(shù)據(jù)層面,數(shù)據(jù)治理涉及的技術(shù)路線、法律法規(guī)、企業(yè)戰(zhàn)略選擇,以及產(chǎn)業(yè)生態(tài)演變趨勢(shì)。算力層面,異構(gòu)計(jì)算及其應(yīng)用場(chǎng)景特別是大算力場(chǎng)景逐漸清晰,算力與軟件算法協(xié)同優(yōu)化將是未來(lái)發(fā)展重點(diǎn)。工程層面,在異構(gòu)計(jì)算范式要求下,人工智能開(kāi)發(fā)涉及的軟硬件環(huán)境愈加復(fù)雜,借由人工智能開(kāi)發(fā)平臺(tái)和軟件框架降低開(kāi)發(fā)運(yùn)維成本將是可行方向。運(yùn)營(yíng)層面,在復(fù)雜的商業(yè)化環(huán)境中,軟件基礎(chǔ)設(shè)施類型項(xiàng)目的推廣依賴有效的開(kāi)發(fā)者關(guān)系運(yùn)營(yíng)加持。
對(duì)于《報(bào)告》的發(fā)布,中國(guó)科學(xué)院院士梅宏表示,人工智能無(wú)疑是這個(gè)時(shí)代驅(qū)動(dòng)數(shù)字化轉(zhuǎn)型的重要技術(shù),對(duì)數(shù)字經(jīng)濟(jì)發(fā)展將發(fā)揮重大而深遠(yuǎn)的影響。建設(shè)并最大化人工智能基礎(chǔ)設(shè)施的開(kāi)放創(chuàng)新賦能作用是一項(xiàng)系統(tǒng)工程,需要從人才、數(shù)據(jù)、算力、工程和運(yùn)營(yíng)等多維度多環(huán)節(jié)協(xié)同發(fā)力、同步推進(jìn),充分發(fā)揮各利益相關(guān)方的積極性和主觀能動(dòng)性。其中,弘揚(yáng)開(kāi)源精神,打造有利于人工智能創(chuàng)新發(fā)展的開(kāi)源生態(tài),是人工智能基礎(chǔ)設(shè)施建設(shè)的重要抓手和必由之路。
報(bào)告全文下載:http://baiyulan.org.cn/ai_infra_2022.pdf
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。