科技行者 10月14日 北京消息:我們可以在嘈雜的房間里,不受干擾地進行對話;我們也能夠在雜亂無章的辦公桌上,找到自己的鑰匙串;也能在驅車前行時,快速發(fā)現(xiàn)路面跑過的小動物——總之,即使面對大量混亂而復雜的信息,我們仍然能夠專注于真正重要的事情并快速作出反應。
有沒有想過,根源是什么?
人類集中注意力的過程,實際就是大腦“探照燈”在關注「相關刺激」的同時過濾掉「其余刺激」的過程,而神經科學家們一直希望找出答案,大腦究竟哪些回路在具體控制聚焦與集中反應,然而數(shù)十年來,他們的研究一直圍繞著大腦皮層部分——即大腦外部的折疊結構,其通常與智能以及高級認知能力相關。很明顯,大腦皮層的活動促進了感官處理能力,從而增強了人們對所關注對象的跟蹤效果。
但現(xiàn)在,一些研究人員正在嘗試另一種方法,希望了解大腦如何擬制信息——而非增強信息。也許更重要的是,他們發(fā)現(xiàn),大腦深處某些更古老的區(qū)域可能才是實現(xiàn)集中能力的關鍵——這是以往的研究一直沒有重視的探索方向。
通過這種方式,科學家們也在無意中獲得了一定進展,開始真正了解到,身體與思想如何通過感官體驗、肢體運動以及更高層次的意識以深刻且密不可分的方式交織在一起。
很長一段時間以來,由于注意力似乎一直與意識以及其他復雜的功能緊密聯(lián)系,因此科學家們首先將其假定為大腦皮層中的活動。1984年,F(xiàn)rancis Crick提出,這種理解方式可能完全背離了實際情況。他認為,注意力集中是由于大腦深處被稱為丘腦的區(qū)域所控制,該區(qū)域的一部分負責接收來自感覺區(qū)域的信號并向皮質提供信息。他提出一種理論——丘腦不僅充當中繼站,同時也扮演著守門人的角色(不只是通道,而且是種篩子)。它會阻斷某些數(shù)據(jù)流,從而讓其它正常通過的信息成為關注重點。
但幾十年過去,人們一直無法真正建立起具有說服力的功能機制體系——這是因為,對實驗動物的注意力進行研究始終困難重重。
但這并沒有嚇退Michael Halassa,這位來自麻省理工學院麥戈文腦科學研究所的神經科學家,希望確定信息在到達大腦皮層之前,究竟經過了怎樣的過濾過程。只要能夠確定這一點,他就可以建立起Crick理論中暗示的精確腦回路結構。
▲ 圖:麻省理工學院神經科學家Michael Halassa探討了以往被忽視的大腦區(qū)域在高級認知過程中發(fā)揮的作用。
他首先注意到,一層被稱為丘腦網狀核(TRN)的抵制性神經元,該層像殼一樣包裹著丘腦的其余部分。在Halassa成為博士后研究員時,他已經在大腦區(qū)域中發(fā)現(xiàn)了一種粗略的門控機制:TRN似乎可以讓動物在清醒時關注感覺輸入,并注意到周邊環(huán)境中的某些事物,但當動物進入睡眠狀態(tài)后,TRN又會抑制其對這些感受的感知與反應。
2015年,Halassa和他的同事們發(fā)現(xiàn)了另一種更精細的門控機制,這進一步將TRN與Crick理論的長期證明聯(lián)系了起來。此次成果的重點在于,動物如何主動將注意力集中在不同的感受身上?研究人員首先讓經過訓練的小鼠學會在閃爍的燈光與純音聲調下奔跑,接下來,他們利用燈光與聲調向動物下達了相互矛盾的命令,并以暗示的方式引導動物忽略其中一種信號,而老鼠的反應即代表它們完成注意力集中切換的效率。在整個過程中,研究人員利用完善的技術關閉大腦中各個區(qū)域的活動,從而去觀察,到底是什么左右著動物的行為。
與預期相符,向大腦其他部位發(fā)出高級指令的「前額葉皮層」仍然至關重要。但是研究小組也觀察到,如果在試驗室要求小鼠關注視覺元素,那么視覺TRN就會開啟神經元以干擾聽覺活動。當聽覺神經元被屏蔽后,小鼠將很難注意到聲音方面的變化。實際上,大腦回路調整的實際是抑制過程,而非興奮過程,其中TRN負責抑制前額葉皮層不想關注的信息。如果老鼠需要區(qū)分聽覺信息的優(yōu)先級,那么前額葉皮質會指揮視覺TRN,增強其抑制視覺丘腦的活動——剝離無關的視覺數(shù)據(jù)。
事實證明,所謂集中注意力的真實過程恰恰相反:大腦并沒有聚焦至需要關注的刺激,而是降低了對其他信息的關注度。
盡管研究取得了成功,但研究人員們又發(fā)現(xiàn)了一個新問題。他們確實證明了Crick的直覺:前額葉皮層控制著對丘腦所傳入感知信息的過濾機制。但是,前額葉皮層與TRN的感知部分并沒有任何直接連接,那么過濾究竟是如何實現(xiàn)的?
但現(xiàn)在,Halassa和他的同事們找到了這塊拼圖的缺失,研究結果讓我們找到了新的注意力研究方向。
研究小組采用了與2015年類似的實驗方式,研究了各個大腦區(qū)域彼此之間的功能影響,及其神經元的連接方式。他們發(fā)現(xiàn),腦回路從前額葉皮層接入更深層的基底神經節(jié)(通常與運動控制等其他功能相關),而后進一步接入TRN與丘腦,最后又返回更高層級的皮質區(qū)域。例如,當視覺信息從眼睛傳遞至視覺丘腦時,如果這部分內容與當前關注任務無關,則幾乎可以被立即攔截。基底神經節(jié)能夠按照前額葉皮層的指示,快速介入并激活視覺TRN,從而過濾掉多余的信號刺激。
馬里蘭州國立衛(wèi)生研究院眼科研究所神經科學家Richard Krauzlis表示,“這是一條有趣的反饋途徑,我之前從來沒有聽說過。”
此外,研究人員們還發(fā)現(xiàn),該機制不僅能夠過濾掉一種感知以提高對另一種感知的感受能力,也能夠在同一種感知之內過濾掉某些具體的信息。例如,當小鼠想要認真聆聽某一種聲音時,TRN有助于抑制掉聽覺信號中與此無關的其他背景噪聲。羅徹斯特大學神經科學家Duje Tadin表示,這對感知處理的影響“可能比針對某一種感知方式的丘腦區(qū)域抑制精確得多。相比之下,后者只是一種比較粗糙的控制方法”。
他補充道,“我們通常會忽略掉那些不太重要的信息,通常來講,我認為這是一種更高效的信息處理方法。這就好比當你身處嘈雜的房間,既可以提高想聽的聲音音量,也可以消除不想聽的聲音音量。”(Tadin研究了其他過程中的這種背景抑制作用,并發(fā)現(xiàn)這類過程比選擇性關注速度更快,且自動程度更高。)
Halassa的發(fā)現(xiàn)表明,大腦過濾多余信號的時間點要比預期中早得多。普林斯頓大學認知神經科學家Ian Fiebelkorn表示,“有趣的是,過濾甚至在信息剛剛抵達視覺皮層時就已經開始了。”
但是,大腦采取的這種感知信息過濾策略存在著明顯的弱點:被忽略的感知信息中可能包含意料之外的重要內容。Fiebelkorn的研究表明,大腦很清楚這種風險,并為其準備了對應的解決方案。
Fiebelkorn解釋道,當人們想到集中注意力時,第一反應總是將其理解成,把意念匯聚成穩(wěn)定的一束,并借此引導自己的認知資源。但就現(xiàn)在來看,“我們的研究證明,這種想法并不靠譜。相反,這道「意念之光」似乎會不斷閃爍。”
根據(jù)他的發(fā)現(xiàn),注意力的集中性并不強,每秒大約四次,以防止動物過分關注環(huán)境中的某種單一對象或者刺激。大腦會非常短暫地抑制當前關注對象,從而為其它刺激保留一點起效空間,并在必要時快速完成關注點切換。他解釋道,“大腦似乎會周期性地分散注意力。”
與Halassa的團隊一樣,F(xiàn)iebelkorn和他的同事們也希望,通過皮層下的其他區(qū)域解釋這種連接機制。目前,他們在研究丘腦中另一部分的作用,但后續(xù)也有計劃對基底神經節(jié)進行一番探索。
這些研究標志著一種關鍵性的轉變:集中注意力的過程,曾經被理解為純皮質區(qū)域的活動。但根據(jù)Krauzlis的說法,過去五年,“人們逐漸意識到,皮質之下才是注意力變化的根源位置。”
芝加哥大學神經生物學家John Maunsell表示,“大多數(shù)人都覺得所有繁重的工作都是由大腦皮層完成的,但我認為實際情況并非如此。”
▲ 圖:Michael Halassa主要關注多電極陣列上,他和他的同事們一直在探尋,大腦如何利用這種結構控制負責信息過濾的神經回路。
事實上,供職于麥戈文腦科學研究所的Michael Halassa發(fā)現(xiàn),基底神經節(jié)在人腦關注活動中有著令人著迷的神奇作用。基底神經節(jié)是大腦中的一種古老區(qū)域,以往人們一直覺得它跟選擇性關注活動毫無關系。Krauzlis表示,“魚也擁有基底神經節(jié),或者說新皮層,其最早能夠回溯到連下頜都沒有的七爪鰻。這些動物擁有一種簡單的基底神經節(jié)形式,其中一些擁有相同的回路結構。”魚的神經回路也許能夠為我們揭開腦部注意力機制的演變之謎。
Halassa認為,注意力與基底神經元之間的聯(lián)系,可能為注意力缺陷多動障礙以及自閉癥等疾病找到可靠的解釋方式。這類病癥的常見表現(xiàn),就是對某些類型的輸入信息特別敏感。
但基底神經節(jié)最有趣的事實之一,在于該結構通常與運動控制有關。而且近期研究也發(fā)現(xiàn),基底神經節(jié)確實與學習獎勵、決策以及其他基于動機的行為有所關聯(lián)。
隨著Halassa實驗室研究成果的發(fā)布,如今基底神經節(jié)的作用已經正式擴展至感知控制領域。Maunsell解釋道,這也凸顯出新的事實,“注意力的本質在于按照正確的順序進行排序,以確保大腦不會被不應分心的事物所干擾。從某種意義上講,這也與基底神經節(jié)的運動結構關聯(lián)有著和諧的邏輯關系。基底神經節(jié)應該負責決定下一步要做什么,而這也涉及下一步應該把資源集中在什么身上。”
這與基于主動推理過程的注意力(以及整體認知水平)提升觀點同樣并行不悖。大腦會主動從環(huán)境當中提取信息,而后對觀察到的外部刺激做出反應。反之亦然,身體通過運動——包括眨眼這類微小的活動——對感知進行引導。Fiebelkorn解釋道,感知與運動系統(tǒng)“并非彼此獨立,而是共同演進。”因此,運動區(qū)域不僅有助于塑造輸出(表現(xiàn)為動物的某種行為),同時也有助于調整輸入。Halassa的發(fā)現(xiàn),為這種主動作用提供了更穩(wěn)固的理論基礎。
阿姆斯特丹大學認知科學家Heleen Slagter指出,“感知服務于行動,因為我們需要首先認識世界,之后才能改變世界。我們通過動作引導來學習如何感知周邊環(huán)境。”與皮層之間的高度互連結構表明,即使在注意力機制之外,這些皮層下結構在高級感知中的作用也比我們以往認為的重要得多。
這反過來又能幫助我們探索「意識」的形成。意識是神經科學當中最難以捉摸的主題。Maunsell表示,正如Halassa等相關研究所得出的結論,“當我們研究注意力與神經之間的關聯(lián)時,實際上也是在研究注意力感知的神經相關性。此次發(fā)現(xiàn),有望成為大腦工作原理研究這一廣闊愿景中的重要組成部分。”
Slagter目前正在研究基底神經節(jié)在意識當中發(fā)揮的作用。她總結道,“我們不僅在操縱自己的身體,也通過自己的身體體驗整個世界。大腦負責表達這個世界,以引導我們在其中采取有意義的行動。因此我認為,有意識的體驗必然與行動緊密關聯(lián),”集中注意力就是其中的典型表現(xiàn)。“意識,應該以行動為導向。”
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結合大語言模型的敘事推理能力與音頻生成技術,通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠將復雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術,通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術僅需添加兩個線性層就能大幅提升運動質量,在多項測試中超越包括Sora在內的商業(yè)模型,為AI視頻生成的實用化應用奠定了重要基礎。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質量管控方法,讓AI在保持技術能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內完成10天全球天氣預報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經網絡技術,通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學領域帶來了效率和精度的雙重突破。