2021年7月7日, 2021世界人工智能大會(huì)(WAIC)唯一外場(chǎng)活動(dòng)——第八屆中國(guó)產(chǎn)業(yè)互聯(lián)網(wǎng)高峰論壇在上海舉行,近400家企業(yè)代表以產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型作為核心議題,依托人工智能、智能制造等新科技與新技術(shù),圍繞人工智能、5G、互聯(lián)網(wǎng)、大數(shù)據(jù)、區(qū)塊鏈等智能交互技術(shù)展開討論,共同探討未來產(chǎn)業(yè)升級(jí)的新機(jī)遇。
澳大利亞科學(xué)院院士、京東探索研究院院長(zhǎng)陶大程博士在大會(huì)開場(chǎng)發(fā)表了題為《超級(jí)模型生態(tài)系統(tǒng)引領(lǐng)新一輪產(chǎn)業(yè)變革》的主題演講,他認(rèn)為,通過構(gòu)建超級(jí)模型生態(tài)系統(tǒng)可以推動(dòng)人工智能技術(shù)更高效地落地,應(yīng)用涵蓋科技創(chuàng)新、經(jīng)濟(jì)發(fā)展、文化融合等多個(gè)維度,以此引領(lǐng)新一輪產(chǎn)業(yè)變革。
澳大利亞科學(xué)院院士、京東探索研究院院長(zhǎng)陶大程博士
陶大程博士認(rèn)為,目前人工智能技術(shù)在落地的過程中存在應(yīng)用場(chǎng)景復(fù)雜、模型單一、算力分布較為分散、基礎(chǔ)理論層面缺乏可解釋性等難點(diǎn),導(dǎo)致中小企業(yè)在數(shù)據(jù)和算力都有限的情況下,更易面臨人工智能的應(yīng)用困境。在這種背景下,超級(jí)模型生態(tài)系統(tǒng)應(yīng)運(yùn)而生。在陶大程博士看來,超級(jí)深度學(xué)習(xí)模型是超級(jí)模型生態(tài)系統(tǒng)的核心,針對(duì)各個(gè)領(lǐng)域中存在的普遍問題,包括數(shù)據(jù)不足、數(shù)據(jù)孤島問題以及模型性能有限等問題,提出了有效的解決方案,包括利用超大規(guī)模無標(biāo)注數(shù)據(jù)進(jìn)行自監(jiān)督預(yù)訓(xùn)練、知識(shí)蒸餾、遷移學(xué)習(xí)等,同時(shí)通過構(gòu)建完備的數(shù)學(xué)理論等模式,增強(qiáng)了模型的可解釋性,使人工智能算法做出的決策更易于評(píng)估。
目前,超級(jí)深度學(xué)習(xí)的發(fā)展趨勢(shì)主要體現(xiàn)在三個(gè)方面,包括訓(xùn)練模型的數(shù)據(jù)量日益增大、數(shù)據(jù)種類愈發(fā)豐富;模型規(guī)模增大、參數(shù)量以指數(shù)倍增加;計(jì)算資源更充足、模型訓(xùn)練的計(jì)算開銷大幅上升等。超級(jí)深度學(xué)習(xí)模型已在一些領(lǐng)域?qū)崿F(xiàn)了相應(yīng)的實(shí)踐,衍生了許多超級(jí)模型,在NLP領(lǐng)域如GPT-3,可以用于機(jī)器翻譯或智能問答等下游任務(wù);在多模態(tài)領(lǐng)域如DALL.E,可以用于視覺信息問答或圖像描述等下游任務(wù)。
陶大程博士認(rèn)為,超級(jí)深度學(xué)習(xí)將會(huì)引領(lǐng)產(chǎn)業(yè)的下一輪變革,它能有效地整合不同模態(tài)、不同來源、不同任務(wù)的數(shù)據(jù)和信息,進(jìn)而滿足新的生產(chǎn)需求、新的應(yīng)用場(chǎng)景、新的商業(yè)模式,實(shí)現(xiàn)數(shù)字經(jīng)濟(jì)變革。可以預(yù)見的是,超級(jí)深度學(xué)習(xí)將會(huì)進(jìn)一步促進(jìn)智能制造、數(shù)智健康、智慧文旅等產(chǎn)業(yè)應(yīng)用落地,成為引領(lǐng)產(chǎn)業(yè)變革的重要力量。
比如,在數(shù)智健康領(lǐng)域,超級(jí)深度學(xué)習(xí)(超級(jí)GNN網(wǎng)絡(luò))可以表征海量分子結(jié)構(gòu),能夠加速新藥物研發(fā);還可以對(duì)全棧醫(yī)學(xué)影像表征,實(shí)現(xiàn)自動(dòng)診斷、治療方案推薦、預(yù)后分析、復(fù)健助理、全周期呵護(hù),更能對(duì)大量多模態(tài)公共服務(wù)數(shù)據(jù)聚合分析,全方位多角度實(shí)現(xiàn)公共健康監(jiān)控,助力人工智能在公共衛(wèi)生、疫情研判、情緒管理、地圖服務(wù)、基因檢測(cè)、藥物研發(fā)、互聯(lián)網(wǎng)醫(yī)院等多種具體場(chǎng)景中發(fā)揮重要的作用。
此外,針對(duì)制造產(chǎn)業(yè),超級(jí)深度學(xué)習(xí)可以實(shí)現(xiàn)全生命周期數(shù)字產(chǎn)業(yè)升級(jí),提升效率、降低成本、敏捷制造,實(shí)現(xiàn)數(shù)智化的生產(chǎn)方式變革;在文化產(chǎn)業(yè)方面,超級(jí)深度學(xué)習(xí)可以促進(jìn)國(guó)際文化產(chǎn)業(yè)變革,以多語(yǔ)言識(shí)別翻譯技術(shù)為基礎(chǔ),實(shí)現(xiàn)多文化的遺產(chǎn)保護(hù)與溝通交流,促進(jìn)多個(gè)國(guó)家文化和商業(yè)的融合和發(fā)展。
陶大程博士表示,各個(gè)國(guó)家都在布局超級(jí)深度學(xué)習(xí),預(yù)計(jì)超級(jí)深度學(xué)習(xí)在未來5到10年將會(huì)對(duì)數(shù)智化社會(huì)供應(yīng)鏈體系起到關(guān)鍵性的支撐作用,從而賦能全產(chǎn)業(yè)鏈,其中包括智能零售、智能物流、智能供應(yīng)鏈等多個(gè)與人類需求密切相關(guān)的產(chǎn)業(yè)。京東探索研究院將會(huì)繼續(xù)在超級(jí)深度學(xué)習(xí)領(lǐng)域深耕,與行業(yè)共探產(chǎn)業(yè)升級(jí)新機(jī)遇,賦能產(chǎn)業(yè)數(shù)智化發(fā)展,為數(shù)字經(jīng)濟(jì)變革貢獻(xiàn)一份“超級(jí)”力量,最終做到理論有支撐,實(shí)際有應(yīng)用,技術(shù)有突破,讓超級(jí)模型生態(tài)系統(tǒng)最終“以人為本、為人類造福”。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。