“解好電力行業(yè)的關(guān)鍵問(wèn)題,有可能會(huì)引領(lǐng)下一波AI浪潮。”中國(guó)工程院院士、阿里云創(chuàng)始人王堅(jiān)2月17日在南方電網(wǎng)總部參加第四屆電力調(diào)度AI應(yīng)用大賽時(shí)表示。該大賽由南方電網(wǎng)、中國(guó)電機(jī)工程學(xué)會(huì)電力系統(tǒng)自動(dòng)化專委會(huì)主辦,阿里云承辦、阿里達(dá)摩院協(xié)辦。
圖:中國(guó)工程院院士、阿里云創(chuàng)始人 王堅(jiān)
王堅(jiān)認(rèn)為,縱觀AI的發(fā)展歷程,從Alpha Go、ImageNet到Alpha Fold、ChatGPT,都是通過(guò)對(duì)某一個(gè)問(wèn)題的攻克,從而帶動(dòng)了人工智能的巨大進(jìn)步。相信電力行業(yè)、工業(yè)領(lǐng)域也能找到這樣一個(gè)問(wèn)題,這將對(duì)社會(huì)發(fā)展、人類生活帶來(lái)更大、更切實(shí)的影響。
王堅(jiān)介紹,在1950年代,人類可以想象AI最了不起的事情就是“下棋”。直到深藍(lán)、AlphaGo的出現(xiàn),AI打敗了國(guó)際象棋大師,人工智能技術(shù)有了很大進(jìn)步。
幾年后,針對(duì)“圖像識(shí)別”這一問(wèn)題,在AI界又出現(xiàn)了基于深度學(xué)習(xí)的ImageNet,使得機(jī)器對(duì)人臉的識(shí)別率超過(guò)了人類。這又將人工智能帶到了新的高度。
近年來(lái)出現(xiàn)的Alpha fold,在發(fā)現(xiàn)蛋白質(zhì)結(jié)構(gòu)方面的能力已經(jīng)超過(guò)了一流的科學(xué)家,挑戰(zhàn)著他們畢生的專業(yè)經(jīng)驗(yàn)。ChatGPT則通過(guò)聊天這一場(chǎng)景,為自然語(yǔ)言處理帶來(lái)了全新的變革。
“人工智能的每次跨越,都是圍繞著對(duì)某一個(gè)問(wèn)題的攻堅(jiān),”王堅(jiān)說(shuō),問(wèn)題定義得好,可以反過(guò)來(lái)帶動(dòng)人工智能學(xué)科的發(fā)展。
王堅(jiān)指出,工業(yè)是用新技術(shù)最好的地方。在電力行業(yè)、工業(yè)領(lǐng)域,我們可以找到比“下棋”更有高度的問(wèn)題,引領(lǐng)下一波AI浪潮。如果能找到、解好這樣一個(gè)問(wèn)題,對(duì)推動(dòng)社會(huì)經(jīng)濟(jì)發(fā)展、人類生活變化,會(huì)產(chǎn)生更巨大、更積極的影響。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。