今年是美國(guó)人工智能協(xié)會(huì)(AAAI – the Association for the Advance of Artificial Intelligence)組織首次在冬天舉辦旗幟性年會(huì):AAAI 2015大會(huì)。大會(huì)總共收到超過(guò)2000篇投稿,最終收錄了500余篇論文,又從中選取200余篇分為十余個(gè)方向在現(xiàn)場(chǎng)報(bào)告。會(huì)議期間,除了這些主流技術(shù)報(bào)告外,主辦方還組織了一系列活動(dòng),包括各類AI競(jìng)賽,機(jī)器人展示,公眾開(kāi)放日,主題辯論,專題研討會(huì)等等。這里我簡(jiǎn)單談?wù)勀切┙o我個(gè)人印象較深的部分。
人工智能研究的道德問(wèn)題
與人工智能有關(guān)的職業(yè)和社會(huì)道德問(wèn)題是主題演講中最熱門的話題。最近一段時(shí)間這個(gè)問(wèn)題似乎確實(shí)受到了整個(gè)社會(huì)的廣泛關(guān)注。一些為大眾所熟知的科技明星,如Stephen Hawking和Elon Musk,表達(dá)了人工智能技術(shù)的突破會(huì)對(duì)人類自身構(gòu)成威脅的擔(dān)憂。而加州大學(xué)伯克利分校計(jì)算機(jī)系教授Stuart Russell(目前最權(quán)威的人工智能專著的作者)則在他的主題演講中表示:現(xiàn)有人工智能技術(shù)水平距離引發(fā)“機(jī)器人統(tǒng)治人類”之類的風(fēng)險(xiǎn)還為時(shí)尚早。不過(guò),他也認(rèn)為人工智能技術(shù)的研究和應(yīng)用與核武器、生化技術(shù)、基因技術(shù)等其他影響巨大的技術(shù)一樣,應(yīng)該受到規(guī)范化約束。“ACM通訊”雜志的主編Moshe Vardi教授做了一個(gè)關(guān)于人工智能技術(shù)進(jìn)步引發(fā)的失業(yè)問(wèn)題的主題演講。他提到以往的幾次技術(shù)革命在導(dǎo)致失業(yè)的同時(shí)也創(chuàng)造了大量新型工作。但人工智能技術(shù)的發(fā)展有可能從本質(zhì)上對(duì)創(chuàng)造新工種貢獻(xiàn)有限,從而在整體上對(duì)就業(yè)產(chǎn)生負(fù)面影響。另外,大會(huì)還組織了一個(gè)關(guān)于自治武器的倫理問(wèn)題的公開(kāi)辯論也相當(dāng)有趣。
個(gè)人覺(jué)得,對(duì)人工智能技術(shù)的這一波“擔(dān)憂”浪潮實(shí)際上反映了外界對(duì)人工智能技術(shù)近年來(lái)進(jìn)步的認(rèn)可(我猜一些人工智能領(lǐng)域的學(xué)者在聽(tīng)到這些“質(zhì)疑”時(shí)其實(shí)是欣慰遠(yuǎn)大于困擾吧)。也許與“機(jī)器是否會(huì)過(guò)于聰明”相比,“機(jī)器是否已經(jīng)真如公眾想象的那樣聰明”才是更值得人工智能學(xué)界擔(dān)心的問(wèn)題。從歷史上看,人們對(duì)機(jī)器智能水平的理解似乎極易產(chǎn)生偏差,往往一開(kāi)始過(guò)于高估,覺(jué)得它們無(wú)所不能,然而在發(fā)現(xiàn)機(jī)器能力達(dá)不到他們的想象之后又轉(zhuǎn)向過(guò)于低估,覺(jué)得現(xiàn)有的技術(shù)什么都不是。這兩種看法又經(jīng)常在媒體的推波助瀾下走向極端化,長(zhǎng)期來(lái)看無(wú)論是哪種極端化看法都會(huì)對(duì)正常嚴(yán)謹(jǐn)?shù)娜斯ぶ悄苎芯吭斐韶?fù)面影響。
人工智能與機(jī)器人技術(shù)
“人工智能與機(jī)器人技術(shù)”是AAAI 2015大會(huì)的一個(gè)主題。從學(xué)科基礎(chǔ)看,人工智能學(xué)科從“什么是智能”的哲學(xué)問(wèn)題出發(fā),從原理上研究在“智能行為機(jī)械化”過(guò)程中的一些根本限制和技術(shù)原則。另一方面機(jī)器人學(xué)科則從工程應(yīng)用的角度出發(fā),考慮如何實(shí)際制造滿足特定“智能化”要求的機(jī)器。兩個(gè)領(lǐng)域本應(yīng)是相輔相成的關(guān)系,機(jī)器人領(lǐng)域?yàn)槿斯ぶ悄茴I(lǐng)域提供實(shí)驗(yàn)和實(shí)踐的機(jī)會(huì),而人工智能領(lǐng)域?yàn)闄C(jī)器人領(lǐng)域提供知識(shí)儲(chǔ)備和技術(shù)工具。”但事實(shí)上兩個(gè)領(lǐng)域的研究在很大程度上是相互脫節(jié)獨(dú)立發(fā)展的。所以現(xiàn)在人們開(kāi)始考慮如何加強(qiáng)這兩個(gè)領(lǐng)域的合作和相互滲透”,本次大會(huì)的學(xué)術(shù)委員會(huì)主席Sven Koenig教授在一次交談中提到。事實(shí)上美國(guó)國(guó)家科學(xué)基金會(huì)(NSF-National Science Foundation)專門就這個(gè)問(wèn)題在會(huì)議期間組織了一個(gè)專題研討會(huì)(只有受邀的領(lǐng)域?qū)<也拍軈⒓?。
在公開(kāi)活動(dòng)中,大會(huì)隆重舉行了一個(gè)對(duì)機(jī)器人項(xiàng)目“Shakey, the robot”的紀(jì)念活動(dòng)。上世紀(jì)60年代末到70年代中期,幾個(gè)研究員為設(shè)計(jì)制造一個(gè)名為Shakey的機(jī)器人發(fā)明了一系列后來(lái)影響廣泛的人工智能技術(shù),包括啟發(fā)式搜索中的A*算法,自動(dòng)規(guī)劃中的STRIP模型,計(jì)算機(jī)視覺(jué)中的霍夫變換,以及如今幾乎已成為標(biāo)準(zhǔn)的機(jī)器人系統(tǒng)框架。在紀(jì)念活動(dòng)中領(lǐng)銜發(fā)言的是人工智能領(lǐng)域元老級(jí)人物Edward Feigenbaum教授,他以一篇極具感染力的演講高度評(píng)價(jià)了Shakey項(xiàng)目的巨大影響。有趣的是,以他的名字命名的Feigenbaum獎(jiǎng)也同時(shí)在紀(jì)念活動(dòng)中頒發(fā),而今年獲獎(jiǎng)?wù)呤俏④浝椎旅裳芯吭旱脑洪L(zhǎng)Eric Horvitz。Feigenbaum獎(jiǎng)是當(dāng)今人工智能界的一個(gè)主要獎(jiǎng)項(xiàng),用來(lái)獎(jiǎng)勵(lì)對(duì)人工智能的實(shí)驗(yàn)方面研究做出突出貢獻(xiàn)的個(gè)人和團(tuán)體。
此外,會(huì)議期間還有一個(gè)Robocup參賽隊(duì)的表演賽。下面是我在現(xiàn)場(chǎng)錄的一小段機(jī)器人足球比賽的視頻(視頻見(jiàn)附件)。
從視頻來(lái)看,現(xiàn)在參加Robocup的機(jī)器人在基本運(yùn)動(dòng)能力方面還比較有限。個(gè)人覺(jué)得,雙足機(jī)器人應(yīng)該先在競(jìng)技場(chǎng)景下“跑起來(lái)”,再考慮踢足球之類的復(fù)雜任務(wù)。因此,現(xiàn)階段我們或許可以先考慮一些諸如“機(jī)器人田徑”之類的比賽…
圖靈測(cè)試的改進(jìn)方案
去年關(guān)于Eugene Goostman通過(guò)圖靈測(cè)試的新聞似乎讓一些研究者們看到一個(gè)“推翻”圖靈測(cè)試的好機(jī)會(huì)。他們先后組織了一個(gè)專題研討會(huì)和一個(gè)正式會(huì)議,主題都叫“Beyond Turing Test”。會(huì)議期間,研究者們提出了一些新的機(jī)器智能的測(cè)試標(biāo)準(zhǔn),試圖代替圖靈測(cè)試。其中有兩個(gè)標(biāo)準(zhǔn)是比較有影響力的:
自動(dòng)游戲博弈的新突破
最近該領(lǐng)域的一個(gè)階段性成果是,德州撲克的一個(gè)最基本的版本被近似完美解決了,具體就是說(shuō)研究員們顯式地找到一個(gè)博弈策略,其平均收益與(這個(gè)游戲的一個(gè))納什均衡策略的差距比連續(xù)玩這個(gè)游戲70年之后結(jié)果的隨機(jī)波動(dòng)還要小。這個(gè)結(jié)果發(fā)表在一月份的一期《科學(xué)》雜志上,而項(xiàng)目的主要負(fù)責(zé)人Michael Bowling教授在會(huì)議期間就這項(xiàng)成果做了一個(gè)主題演講。
會(huì)議期間同時(shí)舉行了General Game Playing比賽。這項(xiàng)比賽要求計(jì)算機(jī)在沒(méi)有人類手工輸入領(lǐng)域知識(shí)的情況下進(jìn)行棋類游戲博弈。為了保證這一點(diǎn),比賽組織方會(huì)維護(hù)一個(gè)包括各種不同游戲的列表,每項(xiàng)游戲的基本規(guī)則都用一套通用語(yǔ)言進(jìn)行形式化表述,并且只在比賽當(dāng)時(shí)才輸入給計(jì)算機(jī)。另外組織者還進(jìn)行了一場(chǎng)有趣的“碳硅大戰(zhàn)“,也就是讓人跟比賽中優(yōu)勝的計(jì)算機(jī)在這個(gè)比賽規(guī)則下比賽,結(jié)果是機(jī)器取得勝利。
深度學(xué)習(xí)
深度學(xué)習(xí)的主將之一Jeff Hinton教授在會(huì)議期間做了一個(gè)主題演講,題目就叫“深度學(xué)習(xí)”。這個(gè)演講毫不意外地成為了整個(gè)會(huì)議參加人數(shù)最多的活動(dòng)。Hinton的演講內(nèi)容主要是對(duì)到目前為止的深度學(xué)習(xí)運(yùn)動(dòng)的總結(jié)性回顧。值得一提的是,Hinton教授對(duì)微軟研究院在整個(gè)深度學(xué)習(xí)運(yùn)動(dòng)中的先驅(qū)性貢獻(xiàn)給予了很大肯定。確實(shí),他的團(tuán)隊(duì)與微軟研究院合作完成的基于深度學(xué)習(xí)的語(yǔ)音識(shí)別研究完全稱得上是直接點(diǎn)燃深度學(xué)習(xí)熱潮的第一批成功案例。
規(guī)劃、決策、約束補(bǔ)償、優(yōu)化、與搜索算法
這些都是人工智能的傳統(tǒng)領(lǐng)域。讓我其實(shí)有一點(diǎn)意外的是,這次會(huì)上相當(dāng)多這些領(lǐng)域里的論文是關(guān)于蒙特卡洛樹(shù)搜索法(Monte Carlo Tree Search)的內(nèi)容——一個(gè)從計(jì)算機(jī)圍棋領(lǐng)域發(fā)展而來(lái)的技術(shù)。而我這次在會(huì)議中做的論文報(bào)告正是關(guān)于如何結(jié)合Monte Carlo Tree Search與傳統(tǒng)的搜索算法,從而設(shè)計(jì)更為通用的人工智能算法。盡管論文主要討論在假設(shè)最差情況下如何規(guī)劃(adversarial planning),我相信論文的主要結(jié)果同樣適用于更為一般的情況,例如基于概率的規(guī)劃問(wèn)題。
另外有些關(guān)于算法選擇(Algorithm Selection)的論文,討論如何通過(guò)增強(qiáng)學(xué)習(xí)等技術(shù)解決組合優(yōu)化問(wèn)題。基本思想是說(shuō),一般而言每一個(gè)單獨(dú)的算法在解決這類問(wèn)題時(shí)都有自己的“盲點(diǎn)”,也就是在最差情況下性能很差(所謂的“NP困難”問(wèn)題)。但是不同的算法盲點(diǎn)往往不同,因此如果在實(shí)際應(yīng)用中能通過(guò)學(xué)習(xí)技術(shù)了解正在面對(duì)的是“哪些”具體問(wèn)題類型,也就有可能有的放矢地選擇合適的算法。個(gè)人認(rèn)為這是一個(gè)有趣的研究方向。
知識(shí)表示與推理
我一直認(rèn)為找到“合適”的知識(shí)模型是實(shí)現(xiàn)人工智能的主要難點(diǎn)所在。個(gè)人對(duì)這個(gè)領(lǐng)域三方面的研究比較感興趣:(1)致力于將抽象模糊的術(shù)語(yǔ)(如知識(shí)、本體、表達(dá)力)賦予具體和形式化語(yǔ)義的工作,例如Judea Pearl教授提出的“因果模型(causal model)“;(2)在學(xué)習(xí)、決策和規(guī)劃等語(yǔ)境下討論知識(shí)表示和推理的工作,例如Leslie Valiant教授提出的”知識(shí)灌輸模型 (Knowledge Infusion)”;(3)從中立獨(dú)立的角度對(duì)已有模型和理論的實(shí)驗(yàn)性或?qū)嵺`性研究。
機(jī)器學(xué)習(xí)及其應(yīng)用
機(jī)器學(xué)習(xí)是這次會(huì)議中最重要的話題,總共占據(jù)了9個(gè)會(huì)議,同時(shí)還有大量論文安排在海報(bào)會(huì)議里。不過(guò)遺憾的是這次會(huì)議我不得不“策略性地”選擇放棄了全部機(jī)器學(xué)習(xí)有關(guān)的內(nèi)容,以換取時(shí)間和精力參加上面所列的所有其他話題的會(huì)議。
作者介紹:
黃鉑鈞,現(xiàn)任微軟亞洲研究院應(yīng)用算法組副研究員,研究興趣包括對(duì)人工智能、計(jì)算機(jī)系統(tǒng)、和抽象計(jì)算模型的理論分析,以及相關(guān)的算法應(yīng)用。
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開(kāi)發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺(jué)解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺(jué)語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺(jué)信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。