今年是美國人工智能協(xié)會(AAAI – the Association for the Advance of Artificial Intelligence)組織首次在冬天舉辦旗幟性年會:AAAI 2015大會。大會總共收到超過2000篇投稿,最終收錄了500余篇論文,又從中選取200余篇分為十余個方向在現(xiàn)場報(bào)告。會議期間,除了這些主流技術(shù)報(bào)告外,主辦方還組織了一系列活動,包括各類AI競賽,機(jī)器人展示,公眾開放日,主題辯論,專題研討會等等。這里我簡單談?wù)勀切┙o我個人印象較深的部分。
人工智能研究的道德問題
與人工智能有關(guān)的職業(yè)和社會道德問題是主題演講中最熱門的話題。最近一段時(shí)間這個問題似乎確實(shí)受到了整個社會的廣泛關(guān)注。一些為大眾所熟知的科技明星,如Stephen Hawking和Elon Musk,表達(dá)了人工智能技術(shù)的突破會對人類自身構(gòu)成威脅的擔(dān)憂。而加州大學(xué)伯克利分校計(jì)算機(jī)系教授Stuart Russell(目前最權(quán)威的人工智能專著的作者)則在他的主題演講中表示:現(xiàn)有人工智能技術(shù)水平距離引發(fā)“機(jī)器人統(tǒng)治人類”之類的風(fēng)險(xiǎn)還為時(shí)尚早。不過,他也認(rèn)為人工智能技術(shù)的研究和應(yīng)用與核武器、生化技術(shù)、基因技術(shù)等其他影響巨大的技術(shù)一樣,應(yīng)該受到規(guī)范化約束。“ACM通訊”雜志的主編Moshe Vardi教授做了一個關(guān)于人工智能技術(shù)進(jìn)步引發(fā)的失業(yè)問題的主題演講。他提到以往的幾次技術(shù)革命在導(dǎo)致失業(yè)的同時(shí)也創(chuàng)造了大量新型工作。但人工智能技術(shù)的發(fā)展有可能從本質(zhì)上對創(chuàng)造新工種貢獻(xiàn)有限,從而在整體上對就業(yè)產(chǎn)生負(fù)面影響。另外,大會還組織了一個關(guān)于自治武器的倫理問題的公開辯論也相當(dāng)有趣。
個人覺得,對人工智能技術(shù)的這一波“擔(dān)憂”浪潮實(shí)際上反映了外界對人工智能技術(shù)近年來進(jìn)步的認(rèn)可(我猜一些人工智能領(lǐng)域的學(xué)者在聽到這些“質(zhì)疑”時(shí)其實(shí)是欣慰遠(yuǎn)大于困擾吧)。也許與“機(jī)器是否會過于聰明”相比,“機(jī)器是否已經(jīng)真如公眾想象的那樣聰明”才是更值得人工智能學(xué)界擔(dān)心的問題。從歷史上看,人們對機(jī)器智能水平的理解似乎極易產(chǎn)生偏差,往往一開始過于高估,覺得它們無所不能,然而在發(fā)現(xiàn)機(jī)器能力達(dá)不到他們的想象之后又轉(zhuǎn)向過于低估,覺得現(xiàn)有的技術(shù)什么都不是。這兩種看法又經(jīng)常在媒體的推波助瀾下走向極端化,長期來看無論是哪種極端化看法都會對正常嚴(yán)謹(jǐn)?shù)娜斯ぶ悄苎芯吭斐韶?fù)面影響。
人工智能與機(jī)器人技術(shù)
“人工智能與機(jī)器人技術(shù)”是AAAI 2015大會的一個主題。從學(xué)科基礎(chǔ)看,人工智能學(xué)科從“什么是智能”的哲學(xué)問題出發(fā),從原理上研究在“智能行為機(jī)械化”過程中的一些根本限制和技術(shù)原則。另一方面機(jī)器人學(xué)科則從工程應(yīng)用的角度出發(fā),考慮如何實(shí)際制造滿足特定“智能化”要求的機(jī)器。兩個領(lǐng)域本應(yīng)是相輔相成的關(guān)系,機(jī)器人領(lǐng)域?yàn)槿斯ぶ悄茴I(lǐng)域提供實(shí)驗(yàn)和實(shí)踐的機(jī)會,而人工智能領(lǐng)域?yàn)闄C(jī)器人領(lǐng)域提供知識儲備和技術(shù)工具。”但事實(shí)上兩個領(lǐng)域的研究在很大程度上是相互脫節(jié)獨(dú)立發(fā)展的。所以現(xiàn)在人們開始考慮如何加強(qiáng)這兩個領(lǐng)域的合作和相互滲透”,本次大會的學(xué)術(shù)委員會主席Sven Koenig教授在一次交談中提到。事實(shí)上美國國家科學(xué)基金會(NSF-National Science Foundation)專門就這個問題在會議期間組織了一個專題研討會(只有受邀的領(lǐng)域?qū)<也拍軈⒓?。
在公開活動中,大會隆重舉行了一個對機(jī)器人項(xiàng)目“Shakey, the robot”的紀(jì)念活動。上世紀(jì)60年代末到70年代中期,幾個研究員為設(shè)計(jì)制造一個名為Shakey的機(jī)器人發(fā)明了一系列后來影響廣泛的人工智能技術(shù),包括啟發(fā)式搜索中的A*算法,自動規(guī)劃中的STRIP模型,計(jì)算機(jī)視覺中的霍夫變換,以及如今幾乎已成為標(biāo)準(zhǔn)的機(jī)器人系統(tǒng)框架。在紀(jì)念活動中領(lǐng)銜發(fā)言的是人工智能領(lǐng)域元老級人物Edward Feigenbaum教授,他以一篇極具感染力的演講高度評價(jià)了Shakey項(xiàng)目的巨大影響。有趣的是,以他的名字命名的Feigenbaum獎也同時(shí)在紀(jì)念活動中頒發(fā),而今年獲獎?wù)呤俏④浝椎旅裳芯吭旱脑洪LEric Horvitz。Feigenbaum獎是當(dāng)今人工智能界的一個主要獎項(xiàng),用來獎勵對人工智能的實(shí)驗(yàn)方面研究做出突出貢獻(xiàn)的個人和團(tuán)體。
此外,會議期間還有一個Robocup參賽隊(duì)的表演賽。下面是我在現(xiàn)場錄的一小段機(jī)器人足球比賽的視頻(視頻見附件)。
從視頻來看,現(xiàn)在參加Robocup的機(jī)器人在基本運(yùn)動能力方面還比較有限。個人覺得,雙足機(jī)器人應(yīng)該先在競技場景下“跑起來”,再考慮踢足球之類的復(fù)雜任務(wù)。因此,現(xiàn)階段我們或許可以先考慮一些諸如“機(jī)器人田徑”之類的比賽…
圖靈測試的改進(jìn)方案
去年關(guān)于Eugene Goostman通過圖靈測試的新聞似乎讓一些研究者們看到一個“推翻”圖靈測試的好機(jī)會。他們先后組織了一個專題研討會和一個正式會議,主題都叫“Beyond Turing Test”。會議期間,研究者們提出了一些新的機(jī)器智能的測試標(biāo)準(zhǔn),試圖代替圖靈測試。其中有兩個標(biāo)準(zhǔn)是比較有影響力的:
自動游戲博弈的新突破
最近該領(lǐng)域的一個階段性成果是,德州撲克的一個最基本的版本被近似完美解決了,具體就是說研究員們顯式地找到一個博弈策略,其平均收益與(這個游戲的一個)納什均衡策略的差距比連續(xù)玩這個游戲70年之后結(jié)果的隨機(jī)波動還要小。這個結(jié)果發(fā)表在一月份的一期《科學(xué)》雜志上,而項(xiàng)目的主要負(fù)責(zé)人Michael Bowling教授在會議期間就這項(xiàng)成果做了一個主題演講。
會議期間同時(shí)舉行了General Game Playing比賽。這項(xiàng)比賽要求計(jì)算機(jī)在沒有人類手工輸入領(lǐng)域知識的情況下進(jìn)行棋類游戲博弈。為了保證這一點(diǎn),比賽組織方會維護(hù)一個包括各種不同游戲的列表,每項(xiàng)游戲的基本規(guī)則都用一套通用語言進(jìn)行形式化表述,并且只在比賽當(dāng)時(shí)才輸入給計(jì)算機(jī)。另外組織者還進(jìn)行了一場有趣的“碳硅大戰(zhàn)“,也就是讓人跟比賽中優(yōu)勝的計(jì)算機(jī)在這個比賽規(guī)則下比賽,結(jié)果是機(jī)器取得勝利。
深度學(xué)習(xí)
深度學(xué)習(xí)的主將之一Jeff Hinton教授在會議期間做了一個主題演講,題目就叫“深度學(xué)習(xí)”。這個演講毫不意外地成為了整個會議參加人數(shù)最多的活動。Hinton的演講內(nèi)容主要是對到目前為止的深度學(xué)習(xí)運(yùn)動的總結(jié)性回顧。值得一提的是,Hinton教授對微軟研究院在整個深度學(xué)習(xí)運(yùn)動中的先驅(qū)性貢獻(xiàn)給予了很大肯定。確實(shí),他的團(tuán)隊(duì)與微軟研究院合作完成的基于深度學(xué)習(xí)的語音識別研究完全稱得上是直接點(diǎn)燃深度學(xué)習(xí)熱潮的第一批成功案例。
規(guī)劃、決策、約束補(bǔ)償、優(yōu)化、與搜索算法
這些都是人工智能的傳統(tǒng)領(lǐng)域。讓我其實(shí)有一點(diǎn)意外的是,這次會上相當(dāng)多這些領(lǐng)域里的論文是關(guān)于蒙特卡洛樹搜索法(Monte Carlo Tree Search)的內(nèi)容——一個從計(jì)算機(jī)圍棋領(lǐng)域發(fā)展而來的技術(shù)。而我這次在會議中做的論文報(bào)告正是關(guān)于如何結(jié)合Monte Carlo Tree Search與傳統(tǒng)的搜索算法,從而設(shè)計(jì)更為通用的人工智能算法。盡管論文主要討論在假設(shè)最差情況下如何規(guī)劃(adversarial planning),我相信論文的主要結(jié)果同樣適用于更為一般的情況,例如基于概率的規(guī)劃問題。
另外有些關(guān)于算法選擇(Algorithm Selection)的論文,討論如何通過增強(qiáng)學(xué)習(xí)等技術(shù)解決組合優(yōu)化問題。基本思想是說,一般而言每一個單獨(dú)的算法在解決這類問題時(shí)都有自己的“盲點(diǎn)”,也就是在最差情況下性能很差(所謂的“NP困難”問題)。但是不同的算法盲點(diǎn)往往不同,因此如果在實(shí)際應(yīng)用中能通過學(xué)習(xí)技術(shù)了解正在面對的是“哪些”具體問題類型,也就有可能有的放矢地選擇合適的算法。個人認(rèn)為這是一個有趣的研究方向。
知識表示與推理
我一直認(rèn)為找到“合適”的知識模型是實(shí)現(xiàn)人工智能的主要難點(diǎn)所在。個人對這個領(lǐng)域三方面的研究比較感興趣:(1)致力于將抽象模糊的術(shù)語(如知識、本體、表達(dá)力)賦予具體和形式化語義的工作,例如Judea Pearl教授提出的“因果模型(causal model)“;(2)在學(xué)習(xí)、決策和規(guī)劃等語境下討論知識表示和推理的工作,例如Leslie Valiant教授提出的”知識灌輸模型 (Knowledge Infusion)”;(3)從中立獨(dú)立的角度對已有模型和理論的實(shí)驗(yàn)性或?qū)嵺`性研究。
機(jī)器學(xué)習(xí)及其應(yīng)用
機(jī)器學(xué)習(xí)是這次會議中最重要的話題,總共占據(jù)了9個會議,同時(shí)還有大量論文安排在海報(bào)會議里。不過遺憾的是這次會議我不得不“策略性地”選擇放棄了全部機(jī)器學(xué)習(xí)有關(guān)的內(nèi)容,以換取時(shí)間和精力參加上面所列的所有其他話題的會議。
作者介紹:
黃鉑鈞,現(xiàn)任微軟亞洲研究院應(yīng)用算法組副研究員,研究興趣包括對人工智能、計(jì)算機(jī)系統(tǒng)、和抽象計(jì)算模型的理論分析,以及相關(guān)的算法應(yīng)用。
好文章,需要你的鼓勵
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運(yùn)動質(zhì)量,在多項(xiàng)測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。