av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃,關(guān)注公眾號

  • 科技行者

  • 算力行者

見證連接與計算的「力量」

首頁 “重返一線”的布林,與哈薩比斯大談AI終局:谷歌亮劍物理世界,智能眼鏡或成“AGI前哨”|谷歌I/O爐邊對話

“重返一線”的布林,與哈薩比斯大談AI終局:谷歌亮劍物理世界,智能眼鏡或成“AGI前哨”|谷歌I/O爐邊對話

2025-05-22 20:31
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-05-22 20:31 ? 周雅

作者 | 周雅

來源 | 科技行者

谷歌I/O大會的第一天,Google聯(lián)合創(chuàng)始人Sergey Brin(謝爾蓋?布林)高調(diào)現(xiàn)身,與Google DeepMind首席執(zhí)行官Demis Hassabis,來了一場爐邊談話,主持人是當(dāng)紅科技播客主理人Alex Kantrowitz。

全程只有半小時,但信息密度很高,話題涵蓋了:AI的前沿模型、AGI的定義與路徑、AI倫理、智能眼鏡、谷歌AI戰(zhàn)略等一系列熱點(diǎn)話題。整體看下來,是這家以工程師文化為底色的公司,在經(jīng)歷了外部沖擊與內(nèi)部整合后,對其“AI信仰”的一次再確認(rèn)與再出發(fā),它關(guān)乎的不僅是AGI的星辰大海,更是如何腳踏實地將Gemini真正融入物理世界。

訪談中,已經(jīng)重返一線的謝爾蓋?布林,談到自己重返谷歌的原因,是受到了AI時代的召喚。他說:

“對于一個計算機(jī)科學(xué)家來說,我們正處在史上獨(dú)一無二的、非常特殊的時刻。老實說,任何一個計算機(jī)科學(xué)家,現(xiàn)在都不應(yīng)該想著退休,都應(yīng)該投身到AI的研究和開發(fā)中來。”

他透露,自己幾乎每天去辦公室,主攻核心技術(shù)和算法,順便“折磨一下”像Demis Hassabis這樣的優(yōu)秀人才(這句是玩笑話)。

而回應(yīng)這兩天的話題中心——智能眼鏡,布林毫不避諱說Google Glass“當(dāng)年犯了不少錯誤”:首先是“技術(shù)代差”;其次是供應(yīng)鏈的教訓(xùn);最后還是太超前了,谷歌在2012年為Google Glass做的那場發(fā)布會演示,還動用了飛艇和翼裝飛行員從天而降,雖然他很懷念那一刻,但現(xiàn)在學(xué)乖了,“應(yīng)該先把產(chǎn)品本身打磨好、再穩(wěn)扎穩(wěn)打推向市場、最后再考慮做不做酷炫演示”。

但他更強(qiáng)調(diào),自己“始終堅信智能眼鏡這一設(shè)備形態(tài)的潛力”,今天的AI已為智能眼鏡注入了新血液,使它有望成為真正有益的交互界面。

Demis Hassabis則更進(jìn)一步,直言“一個真正智能的、無處不在的通用AI助手,會是智能眼鏡的殺手級應(yīng)用”。

“重返一線”的布林,與哈薩比斯大談AI終局:谷歌亮劍物理世界,智能眼鏡或成“AGI前哨”|谷歌I/O爐邊對話

科技播客主理人Alex Kantrowitz(左),Google DeepMind首席執(zhí)行官Demis Hassabis(中間)Google聯(lián)合創(chuàng)始人Sergey Brin(右)

前沿模型的進(jìn)步空間

問:讓我們從前沿模型開始。Demis,根據(jù)我們今天對前沿模型的了解,還有多少提升空間有待釋放?以及,為什么有那么多聰明人說,這個領(lǐng)域的發(fā)展即將趨于平緩?

Demis Hassabis:我們正在取得令人難以置信的進(jìn)展,主題演講中展示的那些精彩內(nèi)容就是證明。通過將現(xiàn)有技術(shù)推向極限,我們正看到巨大的成效。但與此同時,我們也一直在不斷發(fā)明新的東西。要最終實現(xiàn)AGI(通用人工智能),可能還需要1-2個甚至更多的突破,我們有很多想法正在醞釀之中,并希望將它們引入到Gemini。

規(guī)模 vs. 算法:AI進(jìn)步的雙輪驅(qū)動

問:關(guān)于“規(guī)模”(Scale)的問題,在AI發(fā)展中,是不是只要規(guī)模夠大(比如更多數(shù)據(jù)、更強(qiáng)算力)就能解決所有問題?或者說,目前這種“堆規(guī)模”的方式還是在唱主角呢?還是說,它其實更像個配角,需要其他東西來配合?

Demis Hassabis: 我一直覺得,這兩方面都非常重要,缺一不可。

一方面,我們要把現(xiàn)有的技術(shù)和能達(dá)到的規(guī)模(不管是數(shù)據(jù)量還是計算能力)都用到極致,把它們的潛力充分挖掘出來。

另一方面,我們也要花一部分精力去為未來布局,思考接下來幾個月甚至一年后可能出現(xiàn)的新方向。

這樣,一旦有了能帶來十倍甚至更大提升的創(chuàng)新點(diǎn)子或新算法(這就是所謂的“Scaling Law”中提到的,新方法與規(guī)模結(jié)合能帶來巨大效應(yīng)),就能立刻和我們已經(jīng)建立起來的龐大“規(guī)模”結(jié)合起來,產(chǎn)生巨大的威力。所以,在我看來,拼規(guī)模和搞創(chuàng)新,兩手都要硬。

Sergey Brin: 我完全同意Demis的看法,這兩者確實是相輔相成的。AI的進(jìn)步,既可以來自算法本身的優(yōu)化和突破,也可以來自純粹計算能力的增強(qiáng)——比如有了更好的芯片、更強(qiáng)的電力支持、更大的數(shù)據(jù)中心。

回顧過去,如果我們看一些經(jīng)典的科學(xué)計算問題,比如天文學(xué)家模擬星體間萬有引力的“N體問題”,把它的發(fā)展歷程畫出來看,你可能會發(fā)現(xiàn),很多時候算法上的巧妙改進(jìn)帶來的進(jìn)步,甚至比單純增加計算能力帶來的進(jìn)步還要更明顯。

不過好消息是,現(xiàn)在算法創(chuàng)新和算力提升這兩條路我們都在大步向前,所以我們正享受著雙重紅利。

問:Demis,你覺得你們大部分的進(jìn)步,是不是都靠建更大的數(shù)據(jù)中心、用更多的芯片來實現(xiàn)?有人開玩笑說,以后全世界都會被數(shù)據(jù)中心給鋪滿,像貼墻紙一樣,這是你想象的未來嗎?

Demis Hassabis: 我們確實需要建更多的數(shù)據(jù)中心。從科學(xué)的角度看,我們能把普普通通的沙子變成如此強(qiáng)大的計算芯片,這件事本身就一直讓我覺得非常了不起。而且,這些數(shù)據(jù)中心不僅僅是為了訓(xùn)練AI模型。

現(xiàn)在我們有很多模型,像Gemini 2.5 Pro,大家都搶著想用,需求非常大。還有Flash模型,它在保證低成本的同時性能又那么好。我覺得,全世界的人將來都會想用上這些AI技術(shù)。所以,單單是為了讓大家能順暢地使用這些模型,我們就需要大量的數(shù)據(jù)中心。

除此之外,AI也需要時間來“思考”,也就是在它給出答案前進(jìn)行計算和推理(這個過程我們有時也叫“推理時計算,inference time compute,指模型推理時花費(fèi)的計算資源),這同樣需要大量的計算資源。

你們這次也看到了DeepThink這個新模式,你給AI越多的“思考”時間,它給出的結(jié)果就可能越好。對于那些特別重要、特別難的任務(wù),讓AI花很長時間去“琢磨”是完全值得的。我們正在研究怎么能讓AI“思考”得更深、更久,而這在AI運(yùn)行時就需要非常多的芯片來支持。

“思考范式”的價值:從AlphaGo到現(xiàn)實世界

問:Demis 剛才提到了AI的“測試時計算”(或推理時計算,test-time compute)。我們關(guān)注這種讓AI多想一會兒的“推理范式”(reasoning paradigm)也差不多有一年了,過去我們也聊過兩次,這感覺就像是給大語言模型(LLM)這類的AI額外增加了一種能力。你能幫我們再解釋一下,這種“讓AI多想一會兒”能帶來多大的提升,以及它為什么這么重要嗎?

Demis Hassabis: 我們一直非常信奉這種“思考范式”?;仡橝lphaGo和AlphaZero這些智能體在游戲領(lǐng)域的工作,它們的核心就是在一個基礎(chǔ)模型上,再加一套“思考系統(tǒng)”,這種提升其實是可以量化的。

如果我們把AlphaGo或AlphaZero的“思考”功能關(guān)掉,只讓它憑第一感覺(也就是基礎(chǔ)模型直接輸出)下棋,它的水平也不差,可能也是專業(yè)棋手或者大師級別。但是,一旦你把“思考”功能打開,它的水平就能遠(yuǎn)遠(yuǎn)超過頂尖的人類冠軍,大概能提升600個Elo等級分。所以,在游戲里,這種“多思考”帶來的提升是非常明顯的,更不用說比游戲復(fù)雜得多的真實世界了。我認(rèn)為,在現(xiàn)有AI的基礎(chǔ)上,加入這種“思考范式”,潛力會更大。

當(dāng)然,挑戰(zhàn)也是存在的。就像我之前在演講里說的,你的AI模型需要成為一個能理解復(fù)雜世界的“世界模型”(world model),這可比只做一個簡單游戲的模型要難得多。這種復(fù)雜模型本身就可能出錯,而且在進(jìn)行長期規(guī)劃時,這些小錯誤還可能會累積放大。不過,我相信我們在這方面的進(jìn)展不錯。

Sergey Brin:正如Demis所說,DeepMind在強(qiáng)化學(xué)習(xí)這方面確實是先驅(qū),做了很多開創(chuàng)性的工作,AlphaGo和AlphaZero就是很好的例子。如果想單靠“死記硬背”式的訓(xùn)練,達(dá)到AlphaGo(帶思考功能)的水平,可能需要多花5000倍的訓(xùn)練量,即便如此,AlphaGo的成功也是大量訓(xùn)練和“即推理時計算”結(jié)合的成果。所以,這種“多思考”的優(yōu)勢是非常巨大的。

而且,就像我們大多數(shù)人一樣,說話前先想一想總是有好處的。雖然……也不是每次都這樣啦。(現(xiàn)場一片笑聲)

我確實也常常被提醒要(在說話前)這么做(先思考)。但我認(rèn)為,對AI來說,一旦你賦予了它這種“多想一會兒”的能力,它們顯然會變得更加強(qiáng)大。而我們現(xiàn)在在這方面的探索,才剛剛開了個頭,摸到一點(diǎn)皮毛而已,畢竟這些高級模型面世還不到一年。尤其是,如果你考慮到AI在“思考”的過程中,還會調(diào)用各種外部工具或者其他的AI,來幫助它優(yōu)化和完善最終的輸出結(jié)果——那這將是一種極其強(qiáng)大、潛力無限的工作方式。

DeepThink的機(jī)制與AGI的突破口

問:DeepThink這個東西聽起來很有意思。我試著描述一下我的理解,你看對不對:它基本上就像是讓很多個“思考程序”同時開動,并行地進(jìn)行推理,并且它們之間還會相互檢查、相互驗證結(jié)果,最后得出一個更高質(zhì)量的答案。這感覺就像是給AI的推理能力打了“興奮劑”一樣。

Demis,你之前提到,AI行業(yè)還需要幾次關(guān)鍵的進(jìn)步才能真正達(dá)到AGI(通用人工智能)的水平。那么,像DeepThink這樣的機(jī)制,在你看來處于什么位置?它算不算是能讓我們離AGI更近一步的關(guān)鍵技術(shù)之一呢?

Demis Hassabis: 是的。DeepThink可以算是通往AGI所需突破中的一部分,或者說是一個重要的組成部分。當(dāng)然,我們還需要其他方面的進(jìn)步。比如,DeepThink可能主要改進(jìn)的是AI的推理能力,但真正的“從0到1”的原創(chuàng)性、創(chuàng)造力是從哪里來的呢?現(xiàn)在的AI還不能像人類科學(xué)家那樣,獨(dú)立解決一個懸而未決的數(shù)學(xué)猜想,或者提出一個全新的猜想,更不用說在物理學(xué)領(lǐng)域構(gòu)想出一個全新的理論了。我們目前還沒有能做到這種程度創(chuàng)造力的AI系統(tǒng)。

但我相信,具備這種創(chuàng)造力的AI系統(tǒng)正在向我們走來。而像DeepThink這樣的“思考模式”,對于提升AI的思考能力,以及其他許多方面的能力都會很有幫助。同時,我們還需要在構(gòu)建能夠準(zhǔn)確理解和模擬真實世界的“世界模型”方面取得重大進(jìn)展。

我想大家從Veo,特別是Veo 3(我們最新的視頻生成模型)的演示中,已經(jīng)能看到一些端倪了——它能夠憑直覺理解一些物理規(guī)律。我早年不僅研究AI,還做過游戲圖形引擎的開發(fā),我記得那時候,游戲里的光照、陰影、材質(zhì)等等這些效果,都得我們程序員一個一個手動編程實現(xiàn),那真是非常非常復(fù)雜的工作。而現(xiàn)在,這些對物理世界的理解和模擬能力,似乎已經(jīng)內(nèi)化到了AI模型本身之中,這實在是太驚人了。

問:我看到你之前在社交媒體上分享了一張煎鍋里有油的照片,那不是有什么特別的暗示吧?

Demis Hassabis: 哈哈,并沒有什么特別的。也許只是一個微不足道的小小暗示而已。

AGI的定義之爭:為何堅持用AGI?

問:我們今天已經(jīng)好幾次提到AGI(通用人工智能)這個詞了。我感覺現(xiàn)在AI圈子里,很多人好像不太愿意再提AGI了,覺得這個詞被用得太泛濫,有點(diǎn)失去它本來的意義了。但是Demis,你似乎認(rèn)為AGI這個概念依然很重要。能說說為什么嗎?

Demis Hassabis: 我確實認(rèn)為AGI這個概念非常重要。也許我需要找個時間和Shane Legg(DeepMind首席科學(xué)家,也是大約25年前最早提出AGI這個術(shù)語的人之一)一起,就這個問題專門寫點(diǎn)東西來闡述一下。我覺得,現(xiàn)在大家在討論AGI的時候,常常把兩件不同的事情給搞混了。

第一件事是,一個普普通通的正常人,一個個體,他能做些什么?我們?nèi)祟愐呀?jīng)很能干,但每個人真正精通的領(lǐng)域,其實也只是所有知識和技能中的一小部分,對吧?或者換個說法,什么是大約90%的成年人都能做到的事情?這種“普遍人類能力”,對于經(jīng)濟(jì)發(fā)展、對于我們設(shè)計和改進(jìn)各種產(chǎn)品來說,顯然是非常重要的。所以,這是一個很關(guān)鍵的衡量標(biāo)準(zhǔn),我們可以把它叫做“典型人類智能”(typical human intelligence)。

而我所說的AGI,更多的是一個理論層面上的構(gòu)想。它指的是,從根本的架構(gòu)上來看,人類的大腦究竟有能力做到什么?人類大腦是我們理解“通用智能”的一個極其重要的參照點(diǎn),因為它是目前宇宙中我們唯一知道的、能夠證明“通用智能”這種東西確實可能存在的實例。

所以,如果你想說你的AI系統(tǒng)達(dá)到了AGI的水平,你就得證明它能做到一系列的事情,甚至是歷史上那些最頂尖的人類精英(比如愛因斯坦、莫扎特、居里夫人等),憑借著和我們一樣的人類大腦架構(gòu)所能做到的那些事情——注意,不是說要擁有和他們一模一樣的大腦,而是指擁有同樣底層設(shè)計原理的大腦架構(gòu)。我很清楚,現(xiàn)在的AI系統(tǒng)還遠(yuǎn)達(dá)不到這個程度。

現(xiàn)在大家對AGI的很多討論和宣傳,在我看來,問題在于目前的AI還不夠“通用”,也不夠“可靠和一致”。誠然,現(xiàn)在的AI模型已經(jīng)相當(dāng)“博學(xué)”了,它們能做成千上萬種不同的事情,很多表現(xiàn)也確實令人印象深刻。但是,我們每個人只要和現(xiàn)在的聊天機(jī)器人或者AI助手互動一下,不出幾分鐘,就能輕易發(fā)現(xiàn)它們身上這樣那樣的明顯缺陷。比如,一道稍微難一點(diǎn)的高中數(shù)學(xué)題它可能就解不出來,一個很基礎(chǔ)的小游戲它可能也玩不明白。想找到這些AI系統(tǒng)中的“短板”和“漏洞”,一點(diǎn)都不難。

而對我來說,一個系統(tǒng)要想真正稱得上是AGI,它在各個方面的表現(xiàn),都必須比今天的AI要穩(wěn)定得多、可靠得多、達(dá)到高度的一致性。要找出這種AGI系統(tǒng)的一個明顯漏洞,可能需要一個頂尖的專家團(tuán)隊花上好幾個月的時間去研究和測試,而不是像現(xiàn)在這樣,普通人幾分鐘就能發(fā)現(xiàn)問題。

AGI的實現(xiàn)路徑:一家獨(dú)大,還是多點(diǎn)開花?

問:Sergey,這個問題特別適合您。您覺得AGI會先被某一家公司搞定,然后這家公司就“通吃”整個領(lǐng)域,游戲結(jié)束了?還是說,更可能出現(xiàn)像中國或者Anthropic這樣的公司也各自擁有AGI,形成一種“多點(diǎn)開花”的局面?

Sergey Brin: 這是個好問題。我猜,確實可能會有某一家公司、某個國家或者某個組織率先摸到AGI的門檻。不過,AGI本身可能不是一個非黑即白的、能精確定義的“點(diǎn)”,它更像是一個發(fā)展的“范圍”或者說“譜系”。所以,完全有可能在同一個時期,不止一個機(jī)構(gòu)都達(dá)到了差不多的水平,大致進(jìn)入了這個AGI的范圍。

至于那之后會發(fā)生什么?老實說,這太難預(yù)測了。但你可以想象,肯定會有很多家機(jī)構(gòu)都冒出來。在我們AI這個圈子里,你也知道,通常是我們這邊取得一點(diǎn)進(jìn)步,其他公司很快就能學(xué)過去,反過來也一樣,他們有了新東西,我們也會快速跟進(jìn)。這就像大家在玩“跳房子”或者“蛙跳”一樣,你追我趕,不斷超越。所以我認(rèn)為,大家會互相啟發(fā),這種氛圍可能會鼓勵越來越多的機(jī)構(gòu)都努力跨過AGI那個門檻。

問:Demis,您怎么看?

Demis Hassabis: 對整個AI領(lǐng)域來說,大家首先得對“到底什么是AGI”能有個統(tǒng)一的認(rèn)識,這很重要。所以,也許我們應(yīng)該努力推動大家在這個定義上達(dá)成共識。然后,假如AGI真的實現(xiàn)了,肯定會有一些機(jī)構(gòu)跑在前面。

關(guān)鍵在于,這些最先搞出來的AGI系統(tǒng),必須是穩(wěn)定可靠而且絕對安全的。如果能做到這一點(diǎn),那么之后,我們就可以想象,利用這些首批AGI系統(tǒng)作為基礎(chǔ),再去衍生出許許多多架構(gòu)在它們之下的、各種各樣的AI系統(tǒng)。到那時候,可能就會有真正意義上的“個人AGI助手”,以及各種各樣的新鮮事物出現(xiàn)。

但是,就像Sergey說的,未來到底會怎么樣,真的很難預(yù)測。這就像是站在一個“事件視界”(天文學(xué)概念,指黑洞的邊界,一旦越過就無法返回,也無法觀測其內(nèi)部)的邊緣,我們很難看清楚邊界另一邊的景象,也很難準(zhǔn)確預(yù)言那會是什么樣子。

AGI與情感:AI需要“心”嗎?

問:剛才談到了AGI的定義,很多人認(rèn)為AGI主要指的是知識層面的智能,也就是“大腦”的智能。那么,“心靈”的智能呢?AI要想被認(rèn)為是AGI,是不是必須要擁有情感?它能擁有情感嗎?

Demis Hassabis: 我認(rèn)為,AGI首先需要能夠“理解”情感是怎么一回事。至于我們是否希望AI去“模仿”人類的情感,甚至“擁有”真正的情感,這在很大程度上其實是一個設(shè)計上的選擇。從理論上講,我看不出有什么根本性的理由說,AI絕對不可能擁有情感。

但是,AI的情感可能會和我們?nèi)祟惖那楦蟹浅2煌?,或者說,讓AI擁有情感可能根本沒有必要,甚至從某些角度看,我們可能并不希望它們產(chǎn)生像我們?nèi)祟惸菢訌?fù)雜的情感反應(yīng)。所以我認(rèn)為,這個問題目前還是懸而未決的。

隨著我們越來越接近可能實現(xiàn)AGI的時間點(diǎn)(我個人覺得這大概還需要5到10年的時間),我們還有充足的時間去深入研究這些問題。

自我改進(jìn)系統(tǒng)是否有可能?

問:我在想,有什么因素可能會讓AGI到來的時間大大縮短呢?比如說,會不會是因為出現(xiàn)了能夠自我改進(jìn)的AI系統(tǒng)?上星期,我看到一條新聞標(biāo)題,叫“AlphaEvolve”,說的是一種能幫助設(shè)計出更好算法,甚至能改進(jìn)大型語言模型訓(xùn)練方式的AI,我當(dāng)時看了差點(diǎn)從椅子上驚掉下來。所以Demis,你是不是在嘗試引發(fā)一場“智能爆炸”呢?

Demis Hassabis: 哈哈,我們可不是想引發(fā)一場不受控制的“智能爆炸”。首先得說,AlphaEvolve確實是一個非常了不起的系統(tǒng),背后有一個非常優(yōu)秀的團(tuán)隊在做這項工作?,F(xiàn)在一個很有意思的研究方向,就是開始嘗試把其他類型的技術(shù)——比如AlphaEvolve用到的“進(jìn)化編程”技術(shù)——和我們最新研發(fā)的、能力越來越強(qiáng)大的基礎(chǔ)AI模型結(jié)合起來。我個人非常希望在我們的探索性研究中,看到更多這種不同系統(tǒng)之間強(qiáng)強(qiáng)聯(lián)合、相互配合的嘗試。

你說得對,“自我改進(jìn)”確實是可能加速AI發(fā)展的一個重要因素。如果某個AI系統(tǒng)真的找到了一個有效的“自我改進(jìn)循環(huán)”,那確實有可能讓AI的發(fā)展速度比現(xiàn)在我們看到的還要快得多。

我們以前在AlphaZero身上就見證過類似的情況:它從完全隨機(jī)的、什么都不會的狀態(tài)開始,通過自我對弈和自我改進(jìn),在不到24小時的時間里,就學(xué)會了國際象棋和圍棋,并且達(dá)到了超越人類頂尖冠軍的水平。所以我們知道,AI的自我改進(jìn)是完全可能實現(xiàn)的。但是,也得看到,像國際象棋和圍棋這樣的游戲,規(guī)則是非常清晰和有限的。而真實世界要比這些游戲復(fù)雜得多,也混亂得多。所以,這種自我改進(jìn)的方法是否能在更廣泛、更復(fù)雜的現(xiàn)實場景中同樣有效,還有待觀察和驗證。

Sergey Brin重返谷歌的動力:AI時代的召喚

問:我們又聊到了一些非常強(qiáng)大的AI系統(tǒng),而且很明顯,現(xiàn)在開發(fā)這些系統(tǒng)就像一場競賽。這是您決定重新回到谷歌全身心投入工作的原因嗎?

Sergey Brin: 對于一個計算機(jī)科學(xué)家來說,現(xiàn)在我們正處在一個歷史上獨(dú)一無二的、非常特殊的時刻。老實說,任何一個計算機(jī)科學(xué)家,現(xiàn)在都不應(yīng)該想著退休,都應(yīng)該積極投身到AI的研究和開發(fā)中來。

這就是我想說的。歷史上從來沒有出現(xiàn)過像AI這樣既是巨大挑戰(zhàn)又是巨大機(jī)遇的領(lǐng)域,也從來沒有哪項技術(shù)像AI這樣處于如此激動人心的爆發(fā)前夜。

所以我不會說我回來是因為“競賽”——盡管我們完全明白這場競賽的存在,而且,讓我明確一點(diǎn),我相信Gemini將會是第一個實現(xiàn)AGI的系統(tǒng)。但是,真正吸引我的是,能夠親身參與到這場令人難以置信的技術(shù)革命中來。

這和我們當(dāng)年經(jīng)歷Web 1.0時代的感覺完全不同,那個時代也很令人興奮,后來我們又有了移動互聯(lián)網(wǎng)等等。但我認(rèn)為,AI在科學(xué)層面上要比那些都更加令人激動。而且我堅信,AI最終對整個世界產(chǎn)生的影響,也將比互聯(lián)網(wǎng)和智能手機(jī)加起來還要大得多,AI的變革力量將是空前的。

問:那您現(xiàn)在每天具體都做些什么工作呢?

Sergey Brin: (笑) 我主要是在“折磨”像Demis這樣的優(yōu)秀人才吧。Demis他非常了不起,他能容忍我今天“闖入”這次爐邊談話。

我?guī)缀趺刻於紩oogle辦公室,那里有很多人在全力以赴地研發(fā)關(guān)鍵的Gemini文本模型,進(jìn)行模型的預(yù)訓(xùn)練、后訓(xùn)練等等。我主要關(guān)注的就是這些核心技術(shù),偶爾也會參與一些多模態(tài)AI(比如能處理圖像、視頻的AI)的工作,就像你們都看到的Veo 3視頻模型。總的來說,我傾向于深入到非常具體的技術(shù)細(xì)節(jié)中去。

幸運(yùn)的是,我能有這樣的奢侈,把精力完全投入到我感興趣的技術(shù)細(xì)節(jié)上,因為有像Demis這樣的人在負(fù)責(zé)管理和運(yùn)營整個團(tuán)隊。我的科學(xué)興趣就在這里,我著迷于深入研究這些算法,以及它們是如何不斷進(jìn)化和變得更強(qiáng)大的。

谷歌的智能體愿景:為何如此關(guān)注“視覺”與“物理世界”?

問:Demis,我想問一個關(guān)于“智能體”(Agents)的比較寬泛的問題。我注意到,當(dāng)我看其他科技公司展示他們構(gòu)建的智能體時,通常我們看到的是那種能理解對話上下文、但沒有具體形態(tài)的“聲音助手”,而且我們主要是在電腦屏幕上和它互動。

但是,當(dāng)我看DeepMind和谷歌的演示時,智能體往往是通過攝像頭來感知世界,非常強(qiáng)調(diào)“視覺”的交互。而且今天你們也發(fā)布了關(guān)于智能眼鏡的新消息。我想知道,為什么谷歌對于開發(fā)一個能像我們?nèi)祟愐粯?ldquo;看見”世界、理解物理環(huán)境的AI助手或AI伴侶,會這么感興趣呢?

Demis Hassabis: 這背后有好幾個原因。就像我們之前聊到的,我們DeepMind一直以來都對“智能體”這個方向非常著迷,這可以說是我們的傳統(tǒng)了,我們最早就是從研究基于智能體的系統(tǒng)和開發(fā)能玩游戲的AI開始的。我們的長遠(yuǎn)目標(biāo)是構(gòu)建AGI,而一個真正的AGI,顯然必須能夠理解它所處的物理環(huán)境,理解你周圍的真實世界。

在我看來,這種能理解物理世界的AI,至少有兩個非常巨大的應(yīng)用前景:

第一個,是打造一個真正有用的、能在你日常生活中隨時陪伴你的AI助手。它不應(yīng)該只是被困在你的電腦或者某一個設(shè)備里,我們希望它能融入你生活的方方面面,為你提供幫助。所以,它必須能夠“跟著你走”,并且理解你所處的具體物理場景和上下文。

第二個非常重要的事情,是在機(jī)器人技術(shù)領(lǐng)域。我一直覺得,要想讓機(jī)器人技術(shù)真正取得突破性進(jìn)展,能為我們做更多有用的事情,你就需要在機(jī)器人身上實現(xiàn)類似你們在Project Astra(谷歌的一個AI項目,展示了強(qiáng)大的實時多模態(tài)交互能力)演示中看到的那種智能水平。

我一直認(rèn)為,機(jī)器人技術(shù)發(fā)展的瓶頸,其實并不主要在硬件上——盡管現(xiàn)在有很多公司在研發(fā)非常棒的機(jī)器人硬件,我們也和他們有合作——真正的瓶頸在于“軟件智能”,也就是機(jī)器人的“大腦”不夠聰明,這才是長期以來阻礙機(jī)器人技術(shù)發(fā)展的關(guān)鍵因素。但是,我們現(xiàn)在正處在一個非常激動人心的時刻。憑借我們最新發(fā)布的AI模型,特別是Gemini 2.5,再加上我們將要引入的Veo(視頻生成技術(shù))等其他新技術(shù),我相信我們將擁有真正令人興奮的新算法,能夠讓機(jī)器人技術(shù)最終“開竅”,發(fā)揮出它那難以估量的巨大潛力。

最終,一個真正的AGI需要能夠做到所有這些事情——理解視覺信息、理解物理世界、與真實環(huán)境互動等等。我們一直都是朝著這個方向努力的。這就是為什么我們的Gemini模型從一開始設(shè)計,甚至在最早的版本,就是為了支持多種信息模式(多模態(tài),比如同時理解文本、圖像、聲音等)而構(gòu)建的。

也正因為如此,從一開始就只讓它處理文本信息,反而是一件更困難的事情。但最終,我們現(xiàn)在正在收獲當(dāng)初這些艱難但正確決策帶來的豐碩成果。我看到Gemini團(tuán)隊的同事們就坐在前排,我們一起做出了這些正確的決策,盡管過程很艱難,但結(jié)果證明我們是對的,你們今天看到的很多精彩演示,都是這些決策結(jié)出的果實。

Google Glass的經(jīng)驗教訓(xùn)與智能眼鏡的未來

問:你們當(dāng)年從Google Glass項目中學(xué)到了哪些經(jīng)驗教訓(xùn),是谷歌在今天智能眼鏡重新成為熱點(diǎn)的時候可以借鑒和應(yīng)用的呢?

Sergey Brin:這確實是個好問題。我從Google Glass中學(xué)到的東西太多了。老實說,當(dāng)年在Google Glass這個項目上,我們犯了不少錯誤。但我個人始終相信智能眼鏡這種設(shè)備形態(tài)的潛力。所以我很高興看到,我們現(xiàn)在又重新推出了智能眼鏡產(chǎn)品。而且,現(xiàn)在的智能眼鏡看起來就像一副普通的眼鏡,鏡片前沒有了當(dāng)年那個顯眼的棱鏡顯示器。

坦白講,當(dāng)年Google Glass面臨的一個主要問題是技術(shù)還不夠成熟,存在“技術(shù)代差”。而現(xiàn)在進(jìn)入了AI時代,AI賦予了這些智能眼鏡更強(qiáng)大的能力,它們可以在不持續(xù)分散你注意力的情況下,為你提供各種有用的幫助,這種能力比以前強(qiáng)太多了。

此外,還有一個教訓(xùn)是,我當(dāng)時對消費(fèi)電子產(chǎn)品的供應(yīng)鏈、生產(chǎn)制造這些環(huán)節(jié)幾乎一無所知,完全沒意識到要把一款硬件產(chǎn)品做出來,并且以一個合理的價格賣給消費(fèi)者,還要管理好所有的生產(chǎn)、物流等等,這背后有多么的困難。而這一次,我們有了非常棒的合作伙伴來幫助我們一起打造這些智能眼鏡。所以,這又是我們?nèi)〉玫囊粋€進(jìn)步。

我不得不說,我確實有點(diǎn)懷念當(dāng)年我們?yōu)镚oogle Glass做的那場發(fā)布會演示——動用了飛艇和翼裝飛行員從天而降。當(dāng)然,如果今天在Shoreline圓形劇場(Google I/O的舉辦地)能重現(xiàn)那樣的場景,肯定比當(dāng)年在莫斯科要酷得多。不過,玩笑歸玩笑,我們這次應(yīng)該學(xué)乖了:先把產(chǎn)品本身打磨好,確保它足夠優(yōu)秀,然后穩(wěn)扎穩(wěn)打地推向市場,讓大家都能用上,之后再考慮做不做酷炫的演示。這可能才是更明智的做法。

Demis Hassabis: 我想補(bǔ)充一點(diǎn)。你看,谷歌在硬件設(shè)備和智能設(shè)備方面有著非常深厚的積累和輝煌的歷史,我們可以把所有這些寶貴的經(jīng)驗教訓(xùn)都運(yùn)用到今天的產(chǎn)品中。

正如大家所見,我們對我們新款的智能眼鏡感到非常興奮。我一直在和我們的團(tuán)隊探討一個觀點(diǎn)(我不知道他們是不是都同意),但我個人感覺,一個真正智能的、無處不在的“通用AI助手”,才是智能眼鏡這款產(chǎn)品的“殺手級應(yīng)用”。我認(rèn)為,正是這種強(qiáng)大的AI助手能力,將會讓智能眼鏡真正普及開來,當(dāng)然,硬件技術(shù)本身這些年也取得了巨大的進(jìn)步和改善。但我堅信,AI助手才是智能眼鏡最核心、最自然的“殺手锏”。

AI生成內(nèi)容與模型訓(xùn)練:“模型坍塌”是杞人憂天嗎?

問:能不能簡單談?wù)凙I視頻生成技術(shù)?我在Google I/O大會的觀眾席上,看到你們展示的AI視頻生成模型,進(jìn)步水平真的讓我相當(dāng)震驚。你們也請到了一些電影制作人來分享他們的看法。

Demis,關(guān)于AI模型質(zhì)量的問題,如果將來互聯(lián)網(wǎng)上充斥著大量由AI制作的視頻內(nèi)容,當(dāng)這些AI生成的內(nèi)容又被反過來用作訓(xùn)練新AI模型的數(shù)據(jù)時,會不會導(dǎo)致新模型的質(zhì)量下降,甚至比那些只用人類原創(chuàng)內(nèi)容訓(xùn)練出來的模型還要差呢?這種現(xiàn)象有人稱之為“模型坍塌”(model collapse)。

Demis Hassabis: 是的,現(xiàn)在確實有很多人擔(dān)心所謂的“模型坍塌”問題。這不僅僅是視頻領(lǐng)域,任何類型的內(nèi)容,包括文本,都可能面臨類似的挑戰(zhàn)。關(guān)于這一點(diǎn),我想說幾件事:

1、首先,我們對于用來訓(xùn)練AI模型的數(shù)據(jù),在質(zhì)量管理和篩選方面是非常非常嚴(yán)格的。我們有一套嚴(yán)謹(jǐn)?shù)牧鞒虂泶_保數(shù)據(jù)的質(zhì)量。

2、其次,至少對于我們自己開發(fā)的所有生成式AI模型(比如生成圖像、視頻、文本的模型),我們都會給它們生成的內(nèi)容打上一種叫做SynthID的“隱形AI水印”。這種水印技術(shù)非常強(qiáng)大,自從我們一年半前發(fā)布以來,一直表現(xiàn)穩(wěn)定可靠。無論是AI生成的圖像還是視頻,都會嵌入這種肉眼看不見的水印。這樣一來,我們就能檢測出哪些內(nèi)容是AI生成的。

而且,我們正在發(fā)布相關(guān)的工具,讓任何人都可以使用這些工具來檢測內(nèi)容中是否包含這種水印,從而清楚地知道某個圖像或視頻是不是由AI創(chuàng)作的。當(dāng)然,這對于打擊利用AI進(jìn)行造謠、傳播虛假信息(比如深度偽造Deepfake)是非常重要的。同時,有了這種檢測能力,如果你在訓(xùn)練新模型時,不希望使用AI生成的內(nèi)容,你也可以利用它來把這些內(nèi)容從訓(xùn)練數(shù)據(jù)中過濾掉。所以,我個人其實并不認(rèn)為“模型坍塌”會成為一個特別大的問題。

3、最后,我們甚至可能會擁有能力非常非常強(qiáng)大的AI視頻生成模型,強(qiáng)大到它們生成的視頻質(zhì)量非常高,以至于你可以放心地把這些高質(zhì)量的“合成數(shù)據(jù)”(synthetic data,也就是AI生成的數(shù)據(jù))再反過來加入到訓(xùn)練新模型的循環(huán)中,作為額外的數(shù)據(jù)來源。當(dāng)然,這樣做的時候必須非常小心,你需要確保你生成的這些“合成數(shù)據(jù)”和你希望模型學(xué)習(xí)的真實數(shù)據(jù),它們的基本特征和分布是相似的,不能因為加入了合成數(shù)據(jù)反而把模型的認(rèn)知給帶偏了,而且合成數(shù)據(jù)的質(zhì)量本身也必須足夠高才行。

其實,我們在一個完全不同的項目——AlphaFold(我們研發(fā)的蛋白質(zhì)結(jié)構(gòu)預(yù)測AI),已經(jīng)積累了一些這方面的經(jīng)驗。當(dāng)時,我們沒有足夠的真實實驗數(shù)據(jù)來從頭訓(xùn)練AlphaFold,所以我們就需要先用一部分已有的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù),結(jié)合AI預(yù)測并篩選出置信度比較高的預(yù)測結(jié)果(大概挑選了最好的三四百個),然后把這些AI預(yù)測出來的、但質(zhì)量很高的“合成數(shù)據(jù)”再加入到訓(xùn)練數(shù)據(jù)中去。這其實就是一種將真實數(shù)據(jù)和高質(zhì)量合成數(shù)據(jù)混合使用的前沿方法。

所以說,對于那些自動生成的、質(zhì)量不高的內(nèi)容,你是可以想辦法把它們排除在訓(xùn)練數(shù)據(jù)之外的。至少在我們的工作中是這樣做的,我們也希望其他開發(fā)生成式AI技術(shù)的公司能夠效仿,給他們生成的內(nèi)容量加上可靠的水印。這對于打擊深度偽造等濫用行為顯然是非常重要的。

快問快答:Web的未來、AGI的時間表、AI面試與模擬理論

問:10年后的互聯(lián)網(wǎng)(Web)會是什么樣子?

Sergey Brin: 10年后的互聯(lián)網(wǎng)啊?(Demis Hassabis在一旁小聲提醒:“一分鐘內(nèi)回答完哦!”) 天啊,10年!考慮到現(xiàn)在AI發(fā)展這么快,變化太大了,這簡直超出了所有人的想象。老實說,別說10年后的互聯(lián)網(wǎng)了,我覺得我們可能都不知道10年后的整個世界會變成什么樣。

Demis Hassabis: 我覺得Sergey這個回答很實在。要我說,短期來看,互聯(lián)網(wǎng)肯定會發(fā)生翻天覆地的變化,特別是如果我們考慮到未來可能會出現(xiàn)一種“AI智能體優(yōu)先”(Agent-first)的互聯(lián)網(wǎng)。那時候,互聯(lián)網(wǎng)上的信息可能主要是給AI智能體看的,它們之間直接交互,就不再需要像現(xiàn)在這樣,必須把網(wǎng)頁渲染成漂漂亮亮的、給我們?nèi)祟惪吹臉幼恿?。所以,可能過不了幾年,情況就會和現(xiàn)在大不一樣。

問:下一個問題,AGI會在2030年之前實現(xiàn),還是之后實現(xiàn)?

Sergey Brin:2030年???哎呀,你這時間點(diǎn)可真是卡得夠緊的!嗯……我會猜“2030年之前”。

問:Demis呢?

Demis Hassabis: 我猜是“之后”。

問: 有意思,Lex Fridman(另一位知名的AI研究者和播客主持人)也選了“之后”。

Sergey Brin: (對Demis開玩笑說) 別有壓力啊,Demis!

Demis Hassabis: (笑著回答) 看來我得回去更賣力地工作了!

Sergey Brin: (繼續(xù)開玩笑) 我只管提要求,Demis負(fù)責(zé)實現(xiàn)!

問:下一個問題,如果有人在面試你們公司的時候,承認(rèn)自己用了AI來幫忙,你們會雇傭他嗎?

Demis Hassabis: 哦,在面試的時候用AI?。窟@得看他具體是怎么用的。如果他用的是現(xiàn)在這種水平的AI模型來作弊,那可能就不會雇傭了。所以,答案的關(guān)鍵在于“他如何使用AI”。

Sergey Brin: 我自己從來沒參加過什么正式面試。(現(xiàn)場又是一陣笑聲) 所以我也不知道該怎么說。我覺得,如果我去評判別人在面試時具體怎么做,那也太虛偽了。

Demis Hassabis: 其實,我也沒正經(jīng)參加過面試。

問:Demis,你之前發(fā)過一條很有意思的推文,內(nèi)容大概是,一個AI根據(jù)提示詞就生成了一個非常逼真的自然場景的圖片?那條推文的文字是“從自然到模擬,一鍵按下”,你還配了幾個表情符號。結(jié)果,很多人就抓住這條推文大做文章,各種新聞標(biāo)題都寫著“Demis認(rèn)為我們生活在一個模擬世界中”。所以,我們真的生活在一個模擬程序里嗎?

Demis Hassabis: 我不認(rèn)為我們生活在像Nick Bostrom(一位以“模擬理論”而聞名的哲學(xué)家)他們所說的那種模擬世界里,也就是說,我們并非身處某個被設(shè)計好的“游戲”之中——盡管我自己也開發(fā)過很多游戲。

但從更深的層面來看,我認(rèn)為宇宙底層的物理規(guī)律,其本質(zhì)可能與信息理論緊密相關(guān)。所以,或許可以說我們生活在一個“計算的宇宙”之中,但它并不僅僅是一個簡單直接的、像電腦程序一樣的模擬。這個問題太復(fù)雜了,我沒法在一分鐘內(nèi)給你一個完整的答案。

但是,現(xiàn)在這些AI系統(tǒng),能夠如此逼真地模擬出自然界中真實存在的結(jié)構(gòu)和現(xiàn)象,這件事本身就非常有趣,也非常能說明一些問題。我一直在思考我們通過AlphaGo和AlphaFold這類系統(tǒng)所取得的成果,以及它們對我們理解現(xiàn)實世界的意義。我以前也公開談到過這些想法,也許將來某個時候,我會專門寫一篇科學(xué)論文,來深入闡述這些AI的進(jìn)展對于揭示“現(xiàn)實到底是什么”可能意味著什么。

問:Sergey,你想不想也來發(fā)表一個“搞個大新聞”的觀點(diǎn)?

Sergey Brin:關(guān)于“我們是否生活在模擬中”這個問題,我認(rèn)為這個論點(diǎn)是可以無限套娃的。如果我們真的是生活在一個模擬程序里,那么按照同樣的邏輯,那些創(chuàng)造了這個模擬程序的“更高級”的存在,他們自己很可能也因為類似的原因,生活在他們自己的模擬程序里,然后以此類推,一層套一層。

所以我覺得,你要么就得接受我們可能生活在一個無限層疊的“模擬套娃”之中,要么就必須承認(rèn),在某個層面,這種“模擬”的鏈條總得有個盡頭,有一個不再是模擬的,而是真實存在的。

問: 那你個人的猜測是什么呢?

Sergey Brin: 我覺得,當(dāng)我們談?wù)?ldquo;模擬”的時候,我們往往不自覺地站在一個非常以人類為中心的視角來看待問題。我們會想象,是不是有某個像我們一樣有意識、有思想的“存在”,在運(yùn)行這個模擬程序,而且這個“存在”也擁有和我們?nèi)祟愊嗨频男螒B(tài)、欲望和意識。

對我來說,這種以人類為中心的推測,恰恰是這個理論站不住腳的地方。所以我只是覺得,以我們目前的認(rèn)知水平,我們可能還沒有能力去真正理解和推斷所謂“更高一個層級”的現(xiàn)實到底是什么樣的。

分享至
1贊

好文章,需要你的鼓勵

周雅

Miranda
關(guān)注科技創(chuàng)新、技術(shù)投資。以文會友,左手硬核科技,右手浪漫主義。
推薦文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-