核心思想可以簡單總結為:整個神經網絡內的每種可觀察的現象,都可以通過神經網絡進行建模。從這個角度來看,宇宙自身在廣義上也可能是個碩大無朋的神經網絡。
明尼蘇達州德盧斯大學物理學教授Vitaly Vanchurin去年8月在論文預發(fā)表平臺arXiv上發(fā)表了一篇題為《世界即神經網絡》的文章,其中的觀點可謂驚世駭俗。https://arxiv.org/pdf/2008.01540.pdf)
日前,Futurism雜志記者Victor Tangermann采訪了Vanchurin,并就論文內容做出探討。
中心思想
根據論文觀點:
“
我們討論了整個宇宙在其基本層面上屬于神經網絡的可能性。我們在其中確定兩種不同類型的動態(tài)自由度:“可訓練”變量(例如偏差向量或者權重矩陣)以及“隱藏”變量(例如神經元的狀態(tài)向量)。
”
從最基本的層面出發(fā),Vanchurin在論文中嘗試對量子物理學與經典物理學之間之間的鴻溝做出一統(tǒng)性解釋。我們知道,量子物理學在解釋宇宙背景下微觀系統(tǒng)內的動態(tài)方面相當可靠。例如,在處理單一光子時,我們可以根據量子力學理論實現可觀察性、可重復性與可測量性。
但在嘗試將量子物理學與經典物理學對接起來時,我們發(fā)現這些可觀察的量子現象很難與經典觀察結果實現統(tǒng)一,甚至可以說出現了明確的理論斷裂。
爭議
在對宇宙本質的解釋理論進行層層剝離之后,我們發(fā)現其核心永遠是用一種“至高真相”替代另一種“至高真相”。理論家們把從神創(chuàng)論到“缸中之腦”的各種觀點都假定為現實,希望借此對量子力學現象做出可行的解讀。
最終得到的結果有二:其一為“平行世界”,其二為“稱其變量”。而Vanchurin的工作,正是嘗試通過自己的“神經網絡世界”理論對二者做出調和。
為此,Vanchurin得出以下結論:
“
在本文中,我們討論了整個宇宙在最基本的層面上屬于神經網絡的可能性。這是個極為大膽的主張,其中強調的不只是人工神經網絡在分析物理體系或者發(fā)現物理定律方面的可行性,而是更為直接的結論——神經網絡就是我們周遭世界的實際運作方式。從這方面出發(fā),要想證明這一觀點的謬誤,我們只需要找到那些無法用神經網絡原理描述的物理現象。但不幸的是(或者說幸運的是),我們似乎找不到這樣的現象。
”
Vanchurin明確提到,他并不會在“平行世界”理論中添加任何額外的解釋,而這種不做加工的方法也正是論文當中最有趣的哲學意義所在。
如果Vanchurin的成果成功通過同行評審,或者至少啟發(fā)人們開始考慮整個宇宙是個具備完備功能的神經網絡的現實可能性,那么我們將迎來一條寶貴的線索。這條線索也許會讓我們陷入更深層次的困境,但也有可能成為通往終極大一統(tǒng)理論的階梯。
如果我們都是這個巨大神經網絡中的節(jié)點,那么這套網絡的存在目的是什么?宇宙是個巨大的封閉網絡,抑或是某個更大網絡中的單一層?也許我們所接觸的,只是同一網絡當中數萬億個宇宙中的一個。在訓練神經網絡時,我們會運行數百萬乃至數千萬次循環(huán),直到AI完成適當“訓練”。如果說這個背景性的場域真的是更龐大機器內的組成部分,那我們人類會不會只是無數訓練周期中的一輪?
(聲明:本文僅代表作者觀點,不代表科技行者立場。)
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數學推理能力提升8.6%,通用推理提升8.4%,且無需任何數學題目作為訓練材料。研究發(fā)現游戲中的三種推理模式能成功轉移到數學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數學優(yōu)化方法,在合成數據集上實現37.9%的精度提升,并在真實設備上展現出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現,經過強化學習訓練的視覺語言模型雖然表現出"頓悟時刻"現象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。