文|周周
6月11日,OpenAI首席執(zhí)行官Sam Altman在他的個人博客上發(fā)表了一篇文章,題為《溫柔的奇點(The Gentle Singularity)》,他認為超級智能(superintelligence)即將到來,奇點已經(jīng)開始,但這一過程是漸進的而非災難性的。
在他眼中,奇點的進程是這樣的:“我們很快從驚嘆AI能生成精美段落,到好奇它何時能寫出整本精彩小說;從驚訝它能做出救命診斷,到期待它何時能開發(fā)出治愈方案;從驚訝它能創(chuàng)建小程序,到期待它何時能創(chuàng)建整個公司。這就是奇點的進程:奇跡變成常態(tài),然后成為基本條件。”
Altman甚至給出了明確的時間表:
2025年,我們已經(jīng)看到能真正思考和工作的AI代理(Agent);
2026年,可能出現(xiàn)能提出“原創(chuàng)見解”的AI系統(tǒng);
2027年,可能出現(xiàn)能在現(xiàn)實世界執(zhí)行任務的機器人;
2030年,智能(想法)和能源(將想法變?yōu)楝F(xiàn)實的能力)將變得極其豐富,這兩樣東西一直是限制人類進步的主要因素,如果有了大量的智能和能源(再加上好的管理),我們能擁有一切。
傳統(tǒng)上,“奇點”(Singularity)一詞在技術語境中有著特定含義。正如已故科幻作家Vernor Vinge在1993年的論文中所定義的,技術奇點指的是“人類失去對人工智能的控制,導致文明被AI完全主宰的理論時刻”。Vinge將奇點描述為人類的災難性事件,可能導致人類的物理滅絕。
Altman將“奇點”重新定義為技術進步的自然延續(xù),而非人類被取代的轉折點。他在博客里寫道:“從相對論的角度看,奇點是一點一點發(fā)生的,合并也是緩慢進行的。我們正在攀登技術進步的指數(shù)曲線:向前看總是垂直的,向后看起來總是平坦的,但它是一條平滑的曲線。”
不過,Altman也承認存在嚴峻挑戰(zhàn),并提出了兩步走的解決方案:首先,解決AI安全和對齊問題;然后,專注于讓超級智能變得便宜、廣泛可用,避免過度集中在任何個人、公司或國家手中。
有意思的是,他還首次公開了ChatGPT用了多少電:一次普通查詢只用約0.34瓦時的電,這相當于烤箱開一秒多,或者節(jié)能燈泡亮幾分鐘的電量,或者相當于使用約0.000085加侖水,差不多是1/15茶匙。他認為,“未來AI的成本最終會接近于純電力成本。”
值得一提的是,《華盛頓郵報》去年與研究人員合作發(fā)現(xiàn),用GPT-4生成一封100字的郵件大約需要“略多于1瓶水”的資源。研究還發(fā)現(xiàn),耗水量可能會因數(shù)據(jù)中心所在位置不同而變化很大。
《溫柔的奇點》原文如下(經(jīng)編輯):
我們已經(jīng)跨過了一個重要的門檻,AI的大規(guī)模發(fā)展已經(jīng)啟動。人類正在創(chuàng)造超級智能,但令人驚訝的是,這一切發(fā)生得比我們想象中更平常、更自然。
看看周圍——機器人還沒有遍布街頭,大多數(shù)人也沒有整天和AI聊天,人們仍然會生病死亡,我們還不能輕松地去太空旅行,宇宙中仍有大量謎團等待解答。
但我們現(xiàn)在的AI系統(tǒng),在某些方面已經(jīng)超過了人類智能,并且能大大提高人們的工作效率。最難的技術突破已經(jīng)實現(xiàn)了——雖然開發(fā)GPT-4和o3這樣的系統(tǒng)付出了巨大努力,但這些突破將帶我們走得更遠。
AI將在很多領域改變世界,最大的好處是它能加速科學研究和提高生產力,這將極大改善我們的生活質量,未來可能比現(xiàn)在好很多倍??茖W進步是人類發(fā)展的最大推動力,想想我們能獲得多少新發(fā)現(xiàn),這真的很令人興奮!
從某種角度看,ChatGPT已經(jīng)比歷史上任何人都“強大”。每天有數(shù)億人依賴它完成越來越重要的工作,它的一個小功能更新就能產生巨大的積極影響,但如果有一個小缺陷,乘以數(shù)億用戶,也會造成巨大的問題。
2025年,我們已經(jīng)看到能真正思考和工作的AI代理出現(xiàn)。到2026年,可能會出現(xiàn)能提出原創(chuàng)見解的系統(tǒng)。到2027年,或許會有能在現(xiàn)實世界執(zhí)行任務的機器人。
更多人將能創(chuàng)作軟件和藝術作品。雖然專業(yè)人士只要愿意使用這些新工具,仍會比新手做得更好,但這些工具會大大縮小差距。簡單說,一個人在2030年能完成的工作量可能是2020年的好幾倍,這將是一個驚人的變化,很多人會找到方法從中受益。
人類生活的核心部分在2030年代可能不會有太大變化。人們仍會愛家人,表達創(chuàng)造力,玩游戲,在湖里游泳。
但在許多重要方面,2030年代可能會與以往完全不同。我們不知道人工智能會超越人類智能水平多少,但我們很快就會知道答案。
在2030年代,智能和能源——也就是想法和實現(xiàn)想法的能力——將變得極其豐富。這兩樣東西一直是限制人類進步的主要因素,如果有了大量的智能和能源(再加上好的管理),理論上我們能擁有任何其他東西。
我們已經(jīng)生活在令人驚嘆的數(shù)字智能時代,經(jīng)過最初的震驚后,大多數(shù)人已經(jīng)習慣了。我們很快就從驚訝AI能寫出漂亮段落,變成好奇它何時能寫出整本精彩小說;從驚訝它能做出救命診斷,到期待它何時能研發(fā)治療方法;從驚訝它能寫簡單程序,到期待它何時能創(chuàng)建整個公司。這就是技術變革的過程:奇跡很快變成常態(tài),然后成為基本條件。
科學家們告訴我們,使用AI后,他們的工作效率提高了2-3倍。高級AI有許多令人興奮的用途,但最重要的可能是,我們可以用它來加速AI研究本身。我們可能會發(fā)現(xiàn)新的計算方法、更好的算法,以及許多意想不到的東西。如果我們能在一個月或一年內完成原本需要十年的研究,進步速度顯然會大不相同。
從現(xiàn)在開始,我們已經(jīng)開發(fā)的工具將幫助我們獲得更多科學發(fā)現(xiàn),并幫助我們創(chuàng)造更好的AI系統(tǒng)。雖然這還不是AI完全自主更新自己的代碼,但這已經(jīng)是自我改進的早期形態(tài)。
還有其他正在形成的良性循環(huán)。AI創(chuàng)造的經(jīng)濟價值已經(jīng)啟動了一個良性循環(huán),推動更多基礎設施建設來支持這些越來越強大的AI系統(tǒng)。能制造其他機器人的機器人(從某種意義上說,也包括能建造其他數(shù)據(jù)中心的數(shù)據(jù)中心)已經(jīng)不遠了。
假設我們需要用傳統(tǒng)方式制造第一批百萬個人形機器人,但之后這些機器人就能運營整個供應鏈——挖掘和提煉礦物、駕駛卡車、管理工廠等——來制造更多機器人,進而建造更多芯片工廠和數(shù)據(jù)中心,那么發(fā)展速度顯然會大不相同。
隨著數(shù)據(jù)中心生產自動化,智能的成本最終可能接近電力成本。(人們常好奇ChatGPT查詢耗能多少:平均一次查詢用電約0.34瓦時,相當于烤箱運行一秒多,或高效燈泡亮幾分鐘的電量?;蛘呦喈斢谑褂眉s0.000085加侖水,差不多是1/15茶匙。)
技術進步會繼續(xù)加速,而人類幾乎能適應任何變化。會有一些艱難的挑戰(zhàn),比如整類工作崗位消失,但另一方面,世界將變得如此富有,以至于我們能認真考慮以前不敢想的新政策。我們可能不會一下子改變整個社會制度,但幾十年后回頭看,這些漸進變化將積累成巨大轉變。
歷史告訴我們,人類總能找到新的事情做和新的需求,并迅速適應新工具(工業(yè)革命后的工作變化就是個好例子)。人們的期望會提高,但我們的能力也會同步提高,大家都能獲得更好的產品和服務。我們將為彼此創(chuàng)造越來越美好的事物。人類比AI有一個長期且獨特的優(yōu)勢:我們天生關心其他人及他們的想法和行為,而我們對機器并不那么在意。
一千年前的自給自足農民看到許多人所做的事情,可能會說我們都在做“假工作”,只是在玩游戲娛樂自己,因為我們有充足食物和難以想象的奢侈品。我希望一千年后的人看我們那時的工作也會覺得是“假工作”,但我相信那些工作對做它們的人來說會感到非常重要和有滿足感。
新奇跡出現(xiàn)的速度將會非???。我們今天很難想象2035年會有什么發(fā)現(xiàn)——也許我們會從一年解決高能物理問題,到第二年開始太空殖民;或從一年取得重大材料科學突破,到第二年實現(xiàn)真正的高帶寬腦機接口。很多人會選擇和現(xiàn)在差不多的生活方式,但至少一些人可能會選擇“接入”新技術。
展望這樣的未來聽起來難以理解,但實際經(jīng)歷這個過程可能會令人印象深刻卻又可控。從相對論角度看,技術奇點是一點一點發(fā)生的,融合也是慢慢進行的。我們正在攀登技術進步的指數(shù)曲線——向前看總像是陡峭的懸崖,向后看則很平坦,但實際上這是一條平滑的曲線。(想想2020年時,如果有人說2025年會有接近通用人工智能的系統(tǒng),聽起來有多瘋狂,再對比過去5年實際發(fā)生的情況。)
除了巨大的好處,我們也面臨嚴峻挑戰(zhàn)。我們確實需要解決技術和社會層面的安全問題,但考慮到經(jīng)濟影響,讓超級智能廣泛可用同樣重要。最好的前進路徑可能是:
首先解決AI與人類目標一致的問題,確保AI系統(tǒng)能學習并實現(xiàn)人類真正長期想要的東西(社交媒體算法是不一致的例子——它們很擅長讓你不斷刷屏并了解你的短期喜好,但它們通過利用你大腦中的機制,往往會覆蓋你的長期利益)。
然后讓超級智能變得便宜、廣泛可用,避免過度集中在少數(shù)人、公司或國家手中。社會有適應能力、創(chuàng)造力和恢復力。如果我們能利用集體智慧,即使會犯錯誤,有些事情會出錯,但我們能快速學習和適應,最大化技術好處,最小化壞處。在社會共同設定的廣泛邊界內,給用戶充分自由似乎很重要。世界越早開始討論這些邊界和如何定義集體一致性,就越好。
整個AI行業(yè)正在為世界打造一個“大腦”。它會高度個性化,人人易用;我們將只受好創(chuàng)意的限制。長期以來,科技創(chuàng)業(yè)圈常嘲笑“點子人”——那些有想法但需要團隊實現(xiàn)的人?,F(xiàn)在看來,他們即將迎來自己的黃金時代。
OpenAI現(xiàn)在涉足多個領域,但首先,我們是一家超級智能研究公司。我們面前有很多工作,但大部分路徑已經(jīng)清晰,未知區(qū)域正在迅速減少。我們非常感激能做現(xiàn)在的工作。
便宜到幾乎免費的智能已經(jīng)觸手可及。這聽起來可能很瘋狂,但如果我們在2020年告訴你我們今天的成就,那可能比我們對2030年的預測聽起來更瘋狂。
愿我們能平穩(wěn)、快速且平安地通過超級智能時代!
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結合大語言模型的敘事推理能力與音頻生成技術,通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠將復雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術,通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術僅需添加兩個線性層就能大幅提升運動質量,在多項測試中超越包括Sora在內的商業(yè)模型,為AI視頻生成的實用化應用奠定了重要基礎。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質量管控方法,讓AI在保持技術能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內完成10天全球天氣預報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡技術,通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學領域帶來了效率和精度的雙重突破。