9月1日,2022世界人工智能大會在上海開幕。峰會期間,上海白玉蘭開源開放研究院發(fā)布《中國人工智能軟件基礎(chǔ)設(shè)施高質(zhì)量發(fā)展報(bào)告》(以下簡稱《報(bào)告》)。參與調(diào)研的單位包括上海交通大學(xué)人工智能研究院、木蘭開源社區(qū)、OpenVINO中文社區(qū)、飛槳社區(qū)、英特爾、阿里云、亞馬遜云科技、騰源會、微軟Reactor、昇思MindSpore社區(qū)、FATE社區(qū)、BigDL社區(qū)、MagicHub社區(qū)、Ray中文社區(qū)、ModelArts社區(qū)、OpenMLDB社區(qū)、語音之家、希爾貝殼、Zilliz、思賢科技、CSDN、InfoQ、思否、稀土掘金、億歐咨詢、示說、GDG上海、極術(shù)社區(qū)、SeaTunnel社區(qū)、DolphinScheduler社區(qū)、Juicedata社區(qū)、開放群島開源社區(qū)(排名不分先后)等30余家人工智能技術(shù)社區(qū)、數(shù)據(jù)社區(qū)及垂直媒體。
“十四五”規(guī)劃和2035遠(yuǎn)景目標(biāo)提出要以高質(zhì)量發(fā)展為主題,要求人工智能技術(shù)進(jìn)一步加快作用于國民經(jīng)濟(jì)活動。通過完善數(shù)字化技術(shù)和支持能力,在此之上構(gòu)建智能化商業(yè)模式是數(shù)字化轉(zhuǎn)型的核心目標(biāo),人工智能軟件基礎(chǔ)設(shè)施建設(shè)對于完成這一目標(biāo)起到重要作用。然而在人工智能技術(shù)落地的問題上,存在著諸多障礙,技術(shù)價(jià)值貶值和可行性困難在具體市場和應(yīng)用場景中時有發(fā)生。針對這一現(xiàn)實(shí)困境,《報(bào)告》對當(dāng)前人工智能軟件基礎(chǔ)設(shè)施建設(shè)的現(xiàn)狀與問題進(jìn)行了系統(tǒng)梳理,進(jìn)一步提出要從人工智能人才、基礎(chǔ)軟件框架、數(shù)據(jù)治理、工程落地、基礎(chǔ)軟件社區(qū)生態(tài)等不同維度協(xié)同共進(jìn)的發(fā)展思路。
《報(bào)告》近五萬字,分五個章節(jié)從人才、數(shù)據(jù)、算力、工程和運(yùn)營等五個維度進(jìn)行闡述。人才層面,展現(xiàn)我國人工智能開發(fā)者分布現(xiàn)狀及提出人才培養(yǎng)的可行方式。數(shù)據(jù)層面,數(shù)據(jù)治理涉及的技術(shù)路線、法律法規(guī)、企業(yè)戰(zhàn)略選擇,以及產(chǎn)業(yè)生態(tài)演變趨勢。算力層面,異構(gòu)計(jì)算及其應(yīng)用場景特別是大算力場景逐漸清晰,算力與軟件算法協(xié)同優(yōu)化將是未來發(fā)展重點(diǎn)。工程層面,在異構(gòu)計(jì)算范式要求下,人工智能開發(fā)涉及的軟硬件環(huán)境愈加復(fù)雜,借由人工智能開發(fā)平臺和軟件框架降低開發(fā)運(yùn)維成本將是可行方向。運(yùn)營層面,在復(fù)雜的商業(yè)化環(huán)境中,軟件基礎(chǔ)設(shè)施類型項(xiàng)目的推廣依賴有效的開發(fā)者關(guān)系運(yùn)營加持。
對于《報(bào)告》的發(fā)布,中國科學(xué)院院士梅宏表示,人工智能無疑是這個時代驅(qū)動數(shù)字化轉(zhuǎn)型的重要技術(shù),對數(shù)字經(jīng)濟(jì)發(fā)展將發(fā)揮重大而深遠(yuǎn)的影響。建設(shè)并最大化人工智能基礎(chǔ)設(shè)施的開放創(chuàng)新賦能作用是一項(xiàng)系統(tǒng)工程,需要從人才、數(shù)據(jù)、算力、工程和運(yùn)營等多維度多環(huán)節(jié)協(xié)同發(fā)力、同步推進(jìn),充分發(fā)揮各利益相關(guān)方的積極性和主觀能動性。其中,弘揚(yáng)開源精神,打造有利于人工智能創(chuàng)新發(fā)展的開源生態(tài),是人工智能基礎(chǔ)設(shè)施建設(shè)的重要抓手和必由之路。
報(bào)告全文下載:http://baiyulan.org.cn/ai_infra_2022.pdf
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗(yàn)證有效性。