無論是橄欖球運(yùn)動員、機(jī)場交通管制員還是在公園中緊盯自己孩子的父母,我們總能靠大腦記下自己看到的一切。即使是暫時移開視線,剛剛看到的一切也仍然印在我們的腦海中。這種“視覺工作記憶”的能力似乎天然存在,不摻雜任何負(fù)擔(dān)。但麻省理工學(xué)院的一項最新研究表明,大腦在此期間實(shí)際是在高強(qiáng)度運(yùn)轉(zhuǎn)。每當(dāng)有關(guān)鍵物體在我們的視野中移動時(無論是因為物體本身移動,還是我們的目光游移),大腦都會在相對大腦半球的神經(jīng)元之間重新編碼,由此實(shí)現(xiàn)記憶的即時轉(zhuǎn)移。
這項發(fā)現(xiàn)已經(jīng)由Picower學(xué)習(xí)與記憶研究所的神經(jīng)科學(xué)家們發(fā)表在《自然》雜志上。從動物實(shí)驗的角度解釋,我們視覺系統(tǒng)的基礎(chǔ)布局,需要將左腦觀看到的內(nèi)容映射至右腦,并將右腦觀看到的內(nèi)容映射至左腦。
Picower研究所Earl Miller教授指導(dǎo)的在讀博士后、論文一作Scott Brincat提到,“人類必須有能力把握事物在真實(shí)場景中的位置,無論看向哪里,都必須時刻了解位置信息。因為在我們移動視線時,大腦從外部世界獲得的表示總會有所改變。”
在實(shí)驗當(dāng)中,Brincat、Miller及其合作者發(fā)現(xiàn),當(dāng)一個物體在視野中轉(zhuǎn)換時,大腦會迅速利用腦波頻率同步性的顯著變化,將信息從大腦一側(cè)引導(dǎo)至另一側(cè)。這種轉(zhuǎn)移在幾毫秒內(nèi)即可完成,其在另一大腦半球的前額葉皮層中募集一組新的神經(jīng)元,用以存儲記憶信息。這種新的神經(jīng)元集合將根據(jù)對象的新位置對對象進(jìn)行編碼,而大腦將繼續(xù)把該對象識別為之前另一半球視野中的對象。
Miller提到,這種在視野任意活動的同時始終牢記事物相對位置的能力,是我們自由控制視線的基礎(chǔ)。運(yùn)動員們可以將視野中的圖像在左右腦之間往來轉(zhuǎn)移,而不必?fù)?dān)心自己忘記剛剛看到的某一側(cè)情況。即使改變視線位置甚至超出視野以外,運(yùn)動員仍然可以大體推斷當(dāng)前球場上的戰(zhàn)況。
Miller提到,“如果沒有這種能力,我們將是簡單的生物,只能對環(huán)境中當(dāng)下發(fā)生的一切做出反應(yīng),僅此而已。但好在我們可以牢記事物,對自己的行為做出主動控制。換言之,我們不必立即做某些內(nèi)容做出反應(yīng),而是將場景記憶下來以備后用。”
往來轉(zhuǎn)移
在實(shí)驗室中,研究人員們測量了動物在嬉戲時兩個大腦半球前額葉皮層中數(shù)百個神經(jīng)元的活動。這些動物的視線被固定在屏幕一側(cè),物體(例如香蕉)圖像只會暫時出現(xiàn)在屏幕中央。這時,動物只能通過某一側(cè)的視野看到該物體,而且由于腦內(nèi)的交叉“布線”,物體只在一側(cè)的半球皮質(zhì)上接受處理。動物必須牢記此圖像,而后判斷呈現(xiàn)的圖像中是否存在其他物體(例如蘋果)。但在某些試驗中,在將原始物體保存在工作記憶中后,動物被引導(dǎo)將視頻從一側(cè)轉(zhuǎn)換到另一側(cè),借此實(shí)際轉(zhuǎn)換了記憶圖像的所在側(cè)。
很明顯,動物能夠準(zhǔn)確記住所呈現(xiàn)圖像與之前的圖像是否匹配;但在被迫不斷轉(zhuǎn)換視線的情況下,這種判斷能力受到了一點(diǎn)影響。Brincat認(rèn)為,這樣的錯誤表明,大腦也需要開足馬力才能處理好記憶內(nèi)容與所見內(nèi)容之間的差異。
他強(qiáng)調(diào),“這種能力似乎天然存在,不摻雜任何負(fù)擔(dān),但大腦在此期間實(shí)際是在高強(qiáng)度運(yùn)轉(zhuǎn)。”
為了分析動物們大腦中的實(shí)際處理過程,該團(tuán)隊訓(xùn)練出一種解碼程序,用以識別圖像記憶中神經(jīng)活動原始數(shù)據(jù)的具體模式。正如所料,分析結(jié)果表明大腦對于半球內(nèi)的每個圖像進(jìn)行了信息編碼,而信息指示的位置與對象在視野中的實(shí)際位置相反。更值得注意的是,試驗證明在動物視線跨屏幕切換的情況下,編碼記憶信息的神經(jīng)活動也會從一個大腦半球轉(zhuǎn)移至另一大腦半球。
研究小組還衡量了動物神經(jīng)元集體活動或腦電波的整體節(jié)律。他們發(fā)現(xiàn),記憶在從一個半球向另一個半球轉(zhuǎn)移時,始終伴隨著一種標(biāo)志性的節(jié)律變化。隨著信息傳輸?shù)倪M(jìn)行,低頻“θ”波(約4-10赫茲)和高頻“β”波(約17-40 Hz)會在另一半球上同步上升,而“α/β”波(?11-17 赫茲)則同步下降。
這種節(jié)律的波動模式,也在Miller實(shí)驗室中關(guān)于皮質(zhì)如何使用節(jié)律變化傳遞信息的研究中得到了驗證。低頻與高頻節(jié)律組合的增加,代表對感官信息(即動物剛剛看到的事物表示)進(jìn)行編碼或調(diào)用。α/β頻率范圍內(nèi)的功率增加會抑制編碼,由此構(gòu)成感官信息處理的一種“門”機(jī)制。
Miller提到,“這是另一種形式的門,其中由α/β控制大腦兩個半球之間的記憶傳輸。”
意外發(fā)現(xiàn)
但除了節(jié)律模式之外,研究人員還得出另一個驚人的發(fā)現(xiàn):對于特定視野中同一位置相同物體的圖像,如果初始觀看的大腦半球不同,則前額葉皮層會使用不同的神經(jīng)元進(jìn)行重現(xiàn),而非從另一半球處轉(zhuǎn)移記憶。換句話說,與先前在右側(cè)看到香蕉、再將記憶轉(zhuǎn)移到左側(cè)的動物相比,先在視野左側(cè)看到香蕉的動物會使用不同的神經(jīng)元集合來表示此記憶。
對Miller來說,這一發(fā)現(xiàn)有著令人著迷的意義。神經(jīng)科學(xué)家曾認(rèn)為單個神經(jīng)元就是大腦功能中的基本單位,但最近人們開始傾向于神經(jīng)元集合才是這種基本單位。而此次新發(fā)現(xiàn)表明,即使是完全相同的信息,仍然可以由不同的、任意組成的神經(jīng)元集合進(jìn)行編碼。
Miller推測稱,“這些集合似乎也不是大腦的基本功能單元。那么,大腦的功能單元到底是什么?也許是大腦神經(jīng)網(wǎng)絡(luò)活動創(chuàng)造的計算空間。”
除了Crinlith以及Mikael Lundqvist也參與了論文編撰。
此項研究由國立心理健康研究所、海軍研究辦公室、JPB基金會以及國立普通醫(yī)學(xué)科學(xué)研究所提供資金支持。除了Crincat與Miller之外,Jacob Donoghue、Meredith Mahnke、Simon Kornblith以及Mikael Lundqvist也參與了論文編撰。
好文章,需要你的鼓勵
騰訊ARC實(shí)驗室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運(yùn)動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運(yùn)動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。