2021年7月7日, 2021世界人工智能大會(huì)(WAIC)唯一外場(chǎng)活動(dòng)——第八屆中國(guó)產(chǎn)業(yè)互聯(lián)網(wǎng)高峰論壇在上海舉行,近400家企業(yè)代表以產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型作為核心議題,依托人工智能、智能制造等新科技與新技術(shù),圍繞人工智能、5G、互聯(lián)網(wǎng)、大數(shù)據(jù)、區(qū)塊鏈等智能交互技術(shù)展開(kāi)討論,共同探討未來(lái)產(chǎn)業(yè)升級(jí)的新機(jī)遇。
澳大利亞科學(xué)院院士、京東探索研究院院長(zhǎng)陶大程博士在大會(huì)開(kāi)場(chǎng)發(fā)表了題為《超級(jí)模型生態(tài)系統(tǒng)引領(lǐng)新一輪產(chǎn)業(yè)變革》的主題演講,他認(rèn)為,通過(guò)構(gòu)建超級(jí)模型生態(tài)系統(tǒng)可以推動(dòng)人工智能技術(shù)更高效地落地,應(yīng)用涵蓋科技創(chuàng)新、經(jīng)濟(jì)發(fā)展、文化融合等多個(gè)維度,以此引領(lǐng)新一輪產(chǎn)業(yè)變革。
澳大利亞科學(xué)院院士、京東探索研究院院長(zhǎng)陶大程博士
陶大程博士認(rèn)為,目前人工智能技術(shù)在落地的過(guò)程中存在應(yīng)用場(chǎng)景復(fù)雜、模型單一、算力分布較為分散、基礎(chǔ)理論層面缺乏可解釋性等難點(diǎn),導(dǎo)致中小企業(yè)在數(shù)據(jù)和算力都有限的情況下,更易面臨人工智能的應(yīng)用困境。在這種背景下,超級(jí)模型生態(tài)系統(tǒng)應(yīng)運(yùn)而生。在陶大程博士看來(lái),超級(jí)深度學(xué)習(xí)模型是超級(jí)模型生態(tài)系統(tǒng)的核心,針對(duì)各個(gè)領(lǐng)域中存在的普遍問(wèn)題,包括數(shù)據(jù)不足、數(shù)據(jù)孤島問(wèn)題以及模型性能有限等問(wèn)題,提出了有效的解決方案,包括利用超大規(guī)模無(wú)標(biāo)注數(shù)據(jù)進(jìn)行自監(jiān)督預(yù)訓(xùn)練、知識(shí)蒸餾、遷移學(xué)習(xí)等,同時(shí)通過(guò)構(gòu)建完備的數(shù)學(xué)理論等模式,增強(qiáng)了模型的可解釋性,使人工智能算法做出的決策更易于評(píng)估。
目前,超級(jí)深度學(xué)習(xí)的發(fā)展趨勢(shì)主要體現(xiàn)在三個(gè)方面,包括訓(xùn)練模型的數(shù)據(jù)量日益增大、數(shù)據(jù)種類(lèi)愈發(fā)豐富;模型規(guī)模增大、參數(shù)量以指數(shù)倍增加;計(jì)算資源更充足、模型訓(xùn)練的計(jì)算開(kāi)銷(xiāo)大幅上升等。超級(jí)深度學(xué)習(xí)模型已在一些領(lǐng)域?qū)崿F(xiàn)了相應(yīng)的實(shí)踐,衍生了許多超級(jí)模型,在NLP領(lǐng)域如GPT-3,可以用于機(jī)器翻譯或智能問(wèn)答等下游任務(wù);在多模態(tài)領(lǐng)域如DALL.E,可以用于視覺(jué)信息問(wèn)答或圖像描述等下游任務(wù)。
陶大程博士認(rèn)為,超級(jí)深度學(xué)習(xí)將會(huì)引領(lǐng)產(chǎn)業(yè)的下一輪變革,它能有效地整合不同模態(tài)、不同來(lái)源、不同任務(wù)的數(shù)據(jù)和信息,進(jìn)而滿(mǎn)足新的生產(chǎn)需求、新的應(yīng)用場(chǎng)景、新的商業(yè)模式,實(shí)現(xiàn)數(shù)字經(jīng)濟(jì)變革??梢灶A(yù)見(jiàn)的是,超級(jí)深度學(xué)習(xí)將會(huì)進(jìn)一步促進(jìn)智能制造、數(shù)智健康、智慧文旅等產(chǎn)業(yè)應(yīng)用落地,成為引領(lǐng)產(chǎn)業(yè)變革的重要力量。
比如,在數(shù)智健康領(lǐng)域,超級(jí)深度學(xué)習(xí)(超級(jí)GNN網(wǎng)絡(luò))可以表征海量分子結(jié)構(gòu),能夠加速新藥物研發(fā);還可以對(duì)全棧醫(yī)學(xué)影像表征,實(shí)現(xiàn)自動(dòng)診斷、治療方案推薦、預(yù)后分析、復(fù)健助理、全周期呵護(hù),更能對(duì)大量多模態(tài)公共服務(wù)數(shù)據(jù)聚合分析,全方位多角度實(shí)現(xiàn)公共健康監(jiān)控,助力人工智能在公共衛(wèi)生、疫情研判、情緒管理、地圖服務(wù)、基因檢測(cè)、藥物研發(fā)、互聯(lián)網(wǎng)醫(yī)院等多種具體場(chǎng)景中發(fā)揮重要的作用。
此外,針對(duì)制造產(chǎn)業(yè),超級(jí)深度學(xué)習(xí)可以實(shí)現(xiàn)全生命周期數(shù)字產(chǎn)業(yè)升級(jí),提升效率、降低成本、敏捷制造,實(shí)現(xiàn)數(shù)智化的生產(chǎn)方式變革;在文化產(chǎn)業(yè)方面,超級(jí)深度學(xué)習(xí)可以促進(jìn)國(guó)際文化產(chǎn)業(yè)變革,以多語(yǔ)言識(shí)別翻譯技術(shù)為基礎(chǔ),實(shí)現(xiàn)多文化的遺產(chǎn)保護(hù)與溝通交流,促進(jìn)多個(gè)國(guó)家文化和商業(yè)的融合和發(fā)展。
陶大程博士表示,各個(gè)國(guó)家都在布局超級(jí)深度學(xué)習(xí),預(yù)計(jì)超級(jí)深度學(xué)習(xí)在未來(lái)5到10年將會(huì)對(duì)數(shù)智化社會(huì)供應(yīng)鏈體系起到關(guān)鍵性的支撐作用,從而賦能全產(chǎn)業(yè)鏈,其中包括智能零售、智能物流、智能供應(yīng)鏈等多個(gè)與人類(lèi)需求密切相關(guān)的產(chǎn)業(yè)。京東探索研究院將會(huì)繼續(xù)在超級(jí)深度學(xué)習(xí)領(lǐng)域深耕,與行業(yè)共探產(chǎn)業(yè)升級(jí)新機(jī)遇,賦能產(chǎn)業(yè)數(shù)智化發(fā)展,為數(shù)字經(jīng)濟(jì)變革貢獻(xiàn)一份“超級(jí)”力量,最終做到理論有支撐,實(shí)際有應(yīng)用,技術(shù)有突破,讓超級(jí)模型生態(tài)系統(tǒng)最終“以人為本、為人類(lèi)造福”。
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開(kāi)發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺(jué)解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺(jué)語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺(jué)信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。