1996年2月16日,IBM公司的計(jì)算機(jī)程序員在紐約阿蒙克IBM總部拍下“深藍(lán)”與卡斯帕羅夫之間著名的國際象棋世紀(jì)之戰(zhàn)
隨著AI逐步進(jìn)軍策略游戲領(lǐng)域,人類玩家還有必要繼續(xù)“負(fù)隅頑抗”嗎?考慮到AI能夠不斷從錯(cuò)誤中吸取教訓(xùn)、借助一場(chǎng)場(chǎng)比賽提升自身水平,答案恐怕是否定的。更恐怖的是,計(jì)算機(jī)的對(duì)戰(zhàn)速度遠(yuǎn)遠(yuǎn)超過人類——玩得快、學(xué)得更快,這還比什么?
很多人要玩一輩子才能成為撲克高手,但AI沒準(zhǔn)一晚上就能傲視群雄。這樣的基本現(xiàn)實(shí),也給策略游戲世界帶來種種變數(shù)。
作為一個(gè)不斷發(fā)展的新興領(lǐng)域,不少朋友對(duì)于AI并沒有很直觀的感受。非技術(shù)人員接觸AI的一種常見方式就是在線撲克游戲,人類玩家會(huì)在其中與AI相對(duì)抗。這就引出了新問題:到什么時(shí)候,我們才分不清是在跟人玩、還是跟AI玩?
近年來,AI取得了長足進(jìn)步,并在多款策略游戲中表現(xiàn)亮眼:國際象棋、拼字游戲、圍棋以及撲克等等。其戰(zhàn)線之輝煌,甚至讓人類幾乎提不起與之對(duì)抗的念頭。
例如,微軟最新發(fā)布的“Libratus”就在比賽中一舉擊敗四位頂尖德州撲克高手,自己連汗都沒出。
Libratus是由卡耐基梅隆大學(xué)開發(fā)的AI程序,在為期20天的匹茲堡Rivers Casino德州撲克比賽中力壓四位人類高手。而這一結(jié)果,也開啟了AI策略游戲探索之路的新方向。
在本文中,我們將探討如何將AI應(yīng)用于撲克游戲、AI又會(huì)表現(xiàn)出怎樣的發(fā)展前景。
一項(xiàng)最新研究發(fā)現(xiàn),最出色的電腦撲克選手跟人類一樣很擅長虛張聲勢(shì),Liberatus則用實(shí)際行動(dòng)證明不是一樣、而是更擅長。那么是不是在可預(yù)見的未來,計(jì)算機(jī)會(huì)在一切策略游戲中都?jí)旱谷祟悾?/p>
根據(jù)職業(yè)撲克選手Jeff Gross的說法,這種可能性確實(shí)存在。Gross曾在18年前以50美元作底,一路過關(guān)斬將拿下超過500萬美元的職業(yè)錦標(biāo)賽收入。Gross對(duì)各種賭注極高的游戲都很精通,最近又開始轉(zhuǎn)向內(nèi)容創(chuàng)作。他在自己的Twitch頻道上向80000多名粉絲講解撲克技巧,播客節(jié)目也已經(jīng)制作了150多集。
作為最頂尖的撲克高手,Gross對(duì)這波來勢(shì)洶洶的AI入侵也有點(diǎn)迷茫。他解釋道:“我們可以從兩個(gè)角度理解這個(gè)問題。如果AI能力可以持續(xù)增長,那么撲克游戲中最精妙的部分、也就是誤導(dǎo)對(duì)手的能力,很可能被計(jì)算機(jī)所超越。但另一方面,由于騙倒機(jī)器特別困難,所以跟AI對(duì)抗反而非常有趣,甚至未來撲克游戲的對(duì)手就可以全都換成AI技術(shù)了。以后的巨額資金很可能被交給那些能擊敗AI的選手,我個(gè)人對(duì)人類的學(xué)習(xí)力和潛能充滿信心。”
回顧AI技術(shù)在策略游戲中的發(fā)展歷程,我們很容易理解Gross的復(fù)雜情緒。上世紀(jì)八十年代初,國際象棋世界冠軍、也是有史以來最成功的棋手之一加里·卡斯帕羅夫曾經(jīng)做出一個(gè)大膽的預(yù)測(cè),即沒有任何國際象棋程序能夠打敗他。加里在1989年兩度擊敗了IBM的國際象棋AI“深思”(Deep Thought)。幾年之后,卡斯帕羅夫又在多局賽中擊敗了深思的繼任者深藍(lán)。但很遺憾,他在與深藍(lán)的復(fù)賽中創(chuàng)下另一項(xiàng)紀(jì)錄——成為第一個(gè)被國際象棋AI擊敗的世界冠軍。
圖:Jeff Gross
從那時(shí)開始,AI逐漸在策略游戲中占據(jù)了主導(dǎo)地位。快進(jìn)到2019年,當(dāng)時(shí)的世界衛(wèi)冕冠軍Magnus Carlsen在與最強(qiáng)國際象棋程序的100場(chǎng)對(duì)弈中一場(chǎng)未勝??梢哉f從1946年的圖靈到現(xiàn)在,人類終于創(chuàng)造出了接近完美、甚至可以說已臻完美的國際象棋AI。
而撲克游戲的攻克,代表這段旅程又前進(jìn)了一步。自1984年以來,AI開發(fā)者一直高度關(guān)注德州撲克游戲。那一年,Mike Caro開發(fā)出一款名為Orac的基礎(chǔ)撲克AI軟件,并帶著它參加了世界撲克大賽。
根據(jù)最近公布的信息圖來看,從Caro的Orac到卡耐基梅隆大學(xué)的Liberatus,撲克AI實(shí)現(xiàn)了長足發(fā)展。Gross則對(duì)撲克AI的強(qiáng)勁發(fā)展勢(shì)頭毫不意外。
“AI能這么強(qiáng)并不奇怪。這些程序已經(jīng)通過分析數(shù)百萬甚至數(shù)萬億手牌識(shí)別出幾百萬種不同的策略。在與人類對(duì)手打牌時(shí),AI可以輕松識(shí)別出對(duì)方的策略并建立起能夠勝出的機(jī)制。雙方都可以虛張聲勢(shì)、也都可以用梭哈震懾對(duì)手,但人類的誘導(dǎo)能力仍然有限,因?yàn)殄X對(duì)我們來說有意義。但AI會(huì)對(duì)每個(gè)人都采取威壓策略,并通過混合策略讓對(duì)手更難摸清它的真實(shí)意圖。”
而且事實(shí)上,AI并不懂得如何虛張聲勢(shì)、至少跟人類選手的虛張聲勢(shì)并不相同。AI只是在訓(xùn)練中逐漸意識(shí)到,即使自己手頭的牌不怎么強(qiáng)、仍然可以通過持續(xù)跟注賺取回報(bào)。它會(huì)不斷遇到類似的情況、持續(xù)加深自己的這種認(rèn)識(shí),這樣的可能性也讓AI在撲克游戲中占據(jù)了對(duì)人類的比較優(yōu)勢(shì)。于是,AI相對(duì)不易受到虛張聲勢(shì)的影響、而且并不害怕過度跟注。
Gross認(rèn)為,未來的撲克游戲會(huì)迎來幾條演變分支:跟AI國際象棋程序類似,未來的撲克游戲也會(huì)發(fā)展出AI對(duì)AI的比賽,人類選手則繼續(xù)跟自己的同類對(duì)抗;或者,也可能出現(xiàn)某些混合賽事,由最高水平的人類在撲克等策略游戲中嘗試挑戰(zhàn)AI。
如今,Gross預(yù)測(cè)的第一部分已經(jīng)在國際象棋領(lǐng)域成為現(xiàn)實(shí)。國際象棋已經(jīng)發(fā)展出一套強(qiáng)大的AI儲(chǔ)備池,其平均棋力等級(jí)已經(jīng)遠(yuǎn)遠(yuǎn)超過人類選手。目前AI世界冠軍Stockfish 9的棋力ELO評(píng)分為3438,遠(yuǎn)遠(yuǎn)高于人類世界冠軍Magnus Carlsen的2845。
Gross也很能理解AI開發(fā)者為什么會(huì)對(duì)撲克及其他策略類游戲充滿興趣。用他的話說:“據(jù)我了解,AI的終極目標(biāo)就是幫助人們解決日常生活中經(jīng)常出現(xiàn)的問題。類似撲克游戲,我們能看到的只有一些不夠全面的信息。AI需要解決的問題,都在撲克游戲中有所映射。所以從樂觀的角度出發(fā),撲克游戲正在訓(xùn)練AI、讓它的智能水平持續(xù)提升。這也側(cè)面證明了撲克游戲自身的精妙與復(fù)雜。”
Gross的觀察完全正確,AI開發(fā)者確實(shí)希望達(dá)成這樣的目標(biāo)。策略游戲并不是目的,只是一種手段。世界冠軍們也不必介意輸給AI程序,畢竟只要這樣能推進(jìn)AI技術(shù)的發(fā)展,那么他們自己也能在手機(jī)上享受到AI帶來的便利功能——例如幫他們快速試探出對(duì)方能接受的底價(jià)。
可以說,AI技術(shù)的志向要宏大得多。我們正邁進(jìn)一個(gè)嶄新的AI世界,為了讓這個(gè)世界真正如想象般美好,每個(gè)人都需要忍耐路途上的一點(diǎn)顛簸。你說呢?
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。