因為對神經(jīng)網(wǎng)絡深層功能的理解,不僅有助于我們了解其決策機制,同時我們構建更為強大的人工智能系統(tǒng)也至關重要。
中,也解釋了他們如何通過逐一刪除單個神經(jīng)元的方式去理解和判斷神經(jīng)網(wǎng)絡的性能。他們認為,理解神經(jīng)科學與深度學習神經(jīng)網(wǎng)絡之間關聯(lián)性的重要方法之一,正是調查個體神經(jīng)元的作用,特別是那些易于解釋的神經(jīng)元。
研究人員開發(fā)了專門的圖像分類模型,然后逐一刪除其中幾個神經(jīng)元,從而測量每個刪除對模型結果的影響。
據(jù)DeepMind稱,他們的發(fā)現(xiàn)產生了兩個結果:
研究人員廣泛分析了只能對單一輸入圖像類別作出響應,且易于解釋的神經(jīng)元(即“選擇性”神經(jīng)元)。他們發(fā)現(xiàn),在深度學習當中,此類神經(jīng)元包括了"貓神經(jīng)元"、情緒神經(jīng)元以及概括神經(jīng)元; 而在神經(jīng)科學領域,此類神經(jīng)元則包括Jennifer Aniston神經(jīng)元等。然而,這些僅占少數(shù)比例的高選擇性神經(jīng)元在重要性上到底與其它低選擇性、更令人費解且難以解釋的神經(jīng)元有何區(qū)別,目前還不得而知。
具有清晰響應模式的神經(jīng)元(例如對貓的圖像活躍,但對其它圖像皆不敏感的神經(jīng)元)比綜合性的神經(jīng)元(即能夠對各類隨機圖像集發(fā)生反應的神經(jīng)元)更易于解釋
而為了評估神經(jīng)元的重要性,研究人員在測試當中移除了部分神經(jīng)元,從而觀察網(wǎng)絡的分類任務處理效能所發(fā)生的變化。如果其中某個神經(jīng)元非常重要,那么將其移除就會產生極大的破壞性,并顯著降低網(wǎng)絡效能。相反,如果移除的神經(jīng)元并不太重要,那么就不會造成什么影響。
神經(jīng)元缺失對簡單神經(jīng)網(wǎng)絡所造成影響的概念示意圖。較深的神經(jīng)元往往更為活躍。嘗試點擊隱藏層神經(jīng)元并將其移除,觀察輸出神經(jīng)元的活動所發(fā)生的改變。需要注意的是,移除一個或兩個神經(jīng)元對輸出結果的影響很小,而移除大部分神經(jīng)元則會產生顯著的影響,并且其中一部分神經(jīng)元確實比其它神經(jīng)元更為重要!
這一發(fā)現(xiàn)與最近在神經(jīng)科學方面的研究進展相互印證,目前科學家們已經(jīng)證明那些作用不明的神經(jīng)元實際上能夠提供豐富的信息。這意味著我們必須邁過易解釋神經(jīng)元這道難關,才有可能真正搞清楚深層神經(jīng)網(wǎng)絡的運作機制。
雖然"貓神經(jīng)元"可能更易于解釋,但其重要性并不比綜合性且不具備明確偏好的神經(jīng)元更高??梢渣c擊圖中標記,看看重要性與解釋性之間到底存在著怎樣復雜的關系
因此,研究人員的結論是,盡管可解釋神經(jīng)元在直覺上更易于理解(比如"它喜歡狗"),但其重要性并不一定會比缺少明顯偏好的綜合性神經(jīng)元更高。
推廣能力更強的網(wǎng)絡也具有更大的彈性
舉例來說,如果一套圖像分類網(wǎng)絡只能對以前見過的特定小狗圖片進行分類,卻無法對新的小狗圖像完成識別,就可以說是不具備智能。Google Brain、伯克利以及DeepMind最近在ICLR 2017上獲得最佳論文獎項的合作論文就提到,深層網(wǎng)絡能夠簡單記住其訓練當中所見到的每一幅圖像,這代表著其學習方式與人類仍然存在巨大差異。
然而,目前我們往往很難判斷一套神經(jīng)網(wǎng)絡是否已經(jīng)學會了足以推廣到新場景應用的能力。為此,通過逐漸移除越來越大的神經(jīng)元組,研究人員發(fā)現(xiàn)相對于簡單記憶以往在訓練期間見到過的網(wǎng)絡,適應性更強的網(wǎng)絡對神經(jīng)元缺失擁有更好的彈性表現(xiàn)。換句話說,適應性較強的網(wǎng)絡更難被破壞(當然,如果神經(jīng)元移除至一定程度,其仍然會遭到破壞)。
隨著越來越多的神經(jīng)元被移除,具有廣泛適應性的網(wǎng)絡在效能下降速度方面遠低于記憶性網(wǎng)絡
通過這種網(wǎng)絡穩(wěn)健性衡量方式,科學家將能夠評估是否能夠通過為一套網(wǎng)絡提供不符合要求的記憶而對其進行"欺騙"。此外,了解網(wǎng)絡在記憶過程當中的變化也將有助于我們構建新的網(wǎng)絡,從而保證更少地依賴記憶、更多地建立概括能力。
總而言之,這些發(fā)現(xiàn)確實能夠被用于理解神經(jīng)網(wǎng)絡的力量。通過這些方法,我們發(fā)現(xiàn)高選擇性神經(jīng)元在重要性上并不強于非選擇性神經(jīng)元,而適應性更高的網(wǎng)絡對單一神經(jīng)元的依賴性也要低于單純記憶型網(wǎng)絡。這些結果意味著,單一神經(jīng)元的重要性并不像人們想象中的那么高。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結合大語言模型的敘事推理能力與音頻生成技術,通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠將復雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術,通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術僅需添加兩個線性層就能大幅提升運動質量,在多項測試中超越包括Sora在內的商業(yè)模型,為AI視頻生成的實用化應用奠定了重要基礎。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質量管控方法,讓AI在保持技術能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內完成10天全球天氣預報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡技術,通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學領域帶來了效率和精度的雙重突破。