北京時(shí)間1月5日消息,谷歌DeepMind開(kāi)發(fā)的AI在圍棋棋盤(pán)上戰(zhàn)勝韓國(guó)世界冠軍之后再度重返,這一次AlphaGo在網(wǎng)上戰(zhàn)勝了頂尖棋手,而且是悄悄進(jìn)行的。
DeepMind創(chuàng)始人哈撒比斯(左一)與李世石握手
今天早些時(shí)候,谷歌DeepMind創(chuàng)始人丹米斯·哈撒比斯(Demis Hassabis)在Twitter發(fā)布消息,證實(shí)升級(jí)版AlphaGo在網(wǎng)上與真人對(duì)決。
哈撒比斯寫(xiě)道:“在過(guò)去幾天里,我們?cè)诰W(wǎng)上進(jìn)行了一些非正式圍棋比賽,對(duì)局以快棋的形式進(jìn)行……我們的目的只是為了查看系統(tǒng)是否如預(yù)期一樣好。”他還說(shuō):“感謝那些在弈城圍棋網(wǎng)和野狐圍棋網(wǎng)與我們對(duì)弈的棋手,我們的賬號(hào)是Magister(P) 和Master(P),我們還要感謝那些觀戰(zhàn)的人。”
之前許多人都在猜測(cè)這位圍棋高手是誰(shuí),大家都不確定,有人懷疑它是電腦。中國(guó)棋手古力懸賞10萬(wàn)元,尋找可以打敗“Master”的棋手。
DeepMind發(fā)布的消息顯示,非正式測(cè)試可能已經(jīng)結(jié)束,今年晚些時(shí)候,AlphaGo將會(huì)參加一些正式比賽。
附哈撒比斯發(fā)布的最新聲明:
一直以來(lái),我們都在努力改進(jìn)AlphaGo,在過(guò)去幾天里,我們進(jìn)行了一些非正式網(wǎng)上比賽,對(duì)局以快棋的形式進(jìn)行,參加比賽的是最新開(kāi)發(fā)的原型版系統(tǒng),進(jìn)行網(wǎng)上對(duì)決只是為了檢查系統(tǒng),看它是不是和預(yù)料的一樣好。感謝那些在弈城圍棋網(wǎng)和野狐圍棋網(wǎng)與我們對(duì)弈的棋手,我們的賬號(hào)是Magister(P) 和Master(P),我們還要感謝那些觀戰(zhàn)的人。
新版AlphaGo在比賽中下出了一些富有創(chuàng)意、非常漂亮的棋步,我們和圍棋社區(qū)從中學(xué)到了許多東西,對(duì)此我們感到很興奮,結(jié)果讓人滿意。
與AlphaGo對(duì)弈之后,棋手古力發(fā)帖稱:“人類與AI攜手合作,很快將會(huì)揭開(kāi)圍棋的深層秘密。”現(xiàn)在我們的非正式測(cè)試已經(jīng)結(jié)束,今年我們準(zhǔn)備與圍棋組織、專家合作,舉辦正式、完整的比賽,進(jìn)一步探索圍棋的秘密,讓人類與AI互相啟迪,共同進(jìn)步。很快我們就會(huì)公布更多消息。
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開(kāi)發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺(jué)解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺(jué)語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺(jué)信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。