科學(xué)家已經(jīng)習(xí)慣于使用超級計(jì)算機(jī)處理宇宙學(xué)領(lǐng)域的海量數(shù)據(jù),最近卡耐基梅隆大學(xué)的研究團(tuán)隊(duì)找到一種新方法,可以使用常規(guī)的機(jī)器學(xué)習(xí)技術(shù)(與AI繪畫或作曲擁有同樣的底層設(shè)計(jì)),在圖形處理單元(GPU)上實(shí)現(xiàn)高級模擬能力。
這個(gè)名為“無人在此”(This Person Does Not Exist)的研究項(xiàng)目,嘗試使用大家熟知的硬件與神經(jīng)網(wǎng)絡(luò)技術(shù)以高分辨率形式模擬我們的現(xiàn)實(shí)宇宙。這項(xiàng)極具前瞻性的研究,也許會徹底改變我們認(rèn)識宇宙與理解物理定律的方式。
根據(jù)研究小組的說法,使用傳統(tǒng)方法在單一處理核心上運(yùn)行宇宙學(xué)模擬大約需要23天。因此,研究人員傾向于使用超級計(jì)算機(jī)完成此類仿真任務(wù)。之所以如此困難,是因?yàn)槲锢韺W(xué)中仍充斥著種種懸而未決的根本問題。我們找不到一套能夠解釋整個(gè)宇宙的統(tǒng)一規(guī)則,科學(xué)家們也不清楚如何將經(jīng)典物理學(xué)定律同量子領(lǐng)域中觀察到的現(xiàn)象聯(lián)系起來。
為此,我們必須努力探索。在涉及到預(yù)測宇宙中暗物質(zhì)數(shù)量等難題時(shí),科學(xué)家必須嘗試不同的預(yù)設(shè)數(shù)值。只有這樣反復(fù)試錯(cuò),才能最終得出更接近真實(shí)情況的結(jié)果??茖W(xué)家們開始著手模擬,并將發(fā)現(xiàn)與太空望遠(yuǎn)鏡及其他觀測結(jié)果數(shù)據(jù)源進(jìn)行核對,之后再模擬、再核對,如此反復(fù)。
問題所在
超級計(jì)算機(jī)的運(yùn)行成功率極高,租用一個(gè)小時(shí)往往就要花掉數(shù)千美元。與單一GPU的低功耗水平相比,超級計(jì)算機(jī)簡直就像是個(gè)熊熊燃燒的大火爐。
所以對于這類需要反復(fù)試驗(yàn)的問題,超級計(jì)算機(jī)顯然不是最好的解決方案。
路在何方
研究人員將問題歸結(jié)為:目前,我們可以先對宇宙中的小塊圖像進(jìn)行高分辨率模擬,并在大型模擬區(qū)域內(nèi)轉(zhuǎn)為低分辨率圖像模擬。至于大型區(qū)域的高分辨率圖像處理必須慎而又慎,因?yàn)檫@會耗費(fèi)掉大量時(shí)間、精力與能源。
但這樣的現(xiàn)狀,相當(dāng)于在模擬整個(gè)宇宙時(shí)設(shè)下一道不可逾越的鴻溝。貫通天塹的橋梁,就是AI。
卡耐基梅隆大學(xué)團(tuán)隊(duì)選擇的方案并非教導(dǎo)AI以程序化方式模擬整個(gè)宇宙(這仍然可能設(shè)定無窮多個(gè)變量),而是直接以高分辨率形式進(jìn)行圖像模擬。
這大大提升了模擬效率。具體提升了多少?卡耐基梅隆大學(xué)的Jocelyn Duffy表示:經(jīng)過訓(xùn)練的代碼能夠獲取完整的低分辨率模型并執(zhí)行超高分辨率模擬,將其中包含的粒子數(shù)量擴(kuò)展達(dá)512倍。對于宇宙當(dāng)中直徑約5億光年、包含1.34億個(gè)粒子的區(qū)域,原有方法需要560個(gè)小時(shí)才能在單一處理核心上完成高分辨率模擬;而使用新方法后,研究人員僅僅需要36分鐘。在向模擬流程中添加更多粒子后,效果變得更為顯著。對于包含1340億個(gè)粒子的“千億”(相較于上一用例)宇宙,研究人員的新方法在單一圖形處理單元中只需要16個(gè)小時(shí)即可處理完成。如果使用原有方法,這種大小及分辨率的模擬必須配合專用的超級計(jì)算機(jī),處理時(shí)長也將達(dá)到數(shù)月之久。
這不是說AI真能“理解”我們所無法企及的宇宙空間。相反,它只是在以令人信服的方式將低分辨率模擬圖像擴(kuò)充為高分辨率形式,幫助科學(xué)家以更少的時(shí)間、精力與能源投入獲得可靠的模擬結(jié)果。
從本質(zhì)上講,這就像是為AI提供電影的分鏡草稿,再由它輸出實(shí)拍影片的具體樣貌。雖然還不夠完善,但已經(jīng)可以在一定的保真水平下省去真實(shí)拍攝的麻煩。
實(shí)際過程當(dāng)然要比本文的描述復(fù)雜得多。但好在模擬出的宇宙圖像比較容易驗(yàn)證,我們可以直接把結(jié)果跟觀測數(shù)據(jù)進(jìn)行比較。唯一的謎團(tuán),是我們并不知道AI模型是如何完成填充的。
這項(xiàng)最新成果,讓宇宙學(xué)模擬從超級計(jì)算機(jī)的專利變成了完全可以運(yùn)行在游戲PC上的“小case”,研究人員也可以借此快速測試自己的靈感、推動模擬能力的大眾化轉(zhuǎn)型。
從樂觀的角度來說,這項(xiàng)研究有望徹底改變我們對現(xiàn)實(shí)宇宙的觀察方式。如果運(yùn)氣好,我們也許能更好地對暗物質(zhì)、引力效應(yīng)甚至是宇宙起源作出原理性解釋。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動質(zhì)量,在多項(xiàng)測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。