CNET科技資訊網(wǎng) 1月8日 北京消息: 1月6日晚,江蘇衛(wèi)視播出的第四季《最強(qiáng)大腦》節(jié)目中迎來一位特殊選手,百度派出搭載百度大腦的人工智能機(jī)器人“小度”,挑戰(zhàn)最強(qiáng)大腦的名人堂選手。
本場(chǎng)比賽經(jīng)過兩小時(shí)的鏖戰(zhàn),“小度”,憑借在人工智能和人臉識(shí)別領(lǐng)域的深厚積累,以3:2險(xiǎn)勝人類最強(qiáng)大腦的代表王峰。
代表著目前代表中國(guó)人工智能最高水平——百度大腦的“小度”,背后是萬億級(jí)的參數(shù)、千億樣本和千億特征訓(xùn)練,能模擬人腦的工作機(jī)制,學(xué)習(xí)訓(xùn)練極其復(fù)雜的模型。有著世界記憶大師美譽(yù)的名人堂代表王峰,曾率領(lǐng)中國(guó)代表隊(duì)4:0完勝德國(guó)隊(duì),打破快速記憶撲克牌世界紀(jì)錄。
小度與王峰進(jìn)行了對(duì)人臉識(shí)別能力的兩輪比拼,非常緊張激烈,最難的是用于比對(duì)的真人及其照片,年齡跨度居然有二十年之多。以至于章子怡現(xiàn)場(chǎng)高呼:這可比電影好看多了。
在第一輪比賽中,小度和人類選手需要通過分析照片中出現(xiàn)的幼年人臉,來識(shí)別出現(xiàn)場(chǎng)20年后的成年人,面對(duì)雙胞胎識(shí)別這一難題,小度精準(zhǔn)識(shí)別,以72.99%—高于第二張0.01%的識(shí)別率成功鎖定目標(biāo),而名人堂王峰則1:0落敗。
在第二輪比賽中,小度和王峰面對(duì)照片中出現(xiàn)的人數(shù)眾多、現(xiàn)場(chǎng)實(shí)時(shí)照片傳輸、現(xiàn)場(chǎng)攝像機(jī)捕捉晃動(dòng)、燈光干擾、化妝、微整形等影響,頂住壓力,表現(xiàn)同樣優(yōu)秀,在30張共近千人臉的小學(xué)畢業(yè)照中成功選出了主人公。最終小度機(jī)器人以3:2擊敗名人堂選手王峰。
對(duì)于小度機(jī)器人贏得勝利,現(xiàn)場(chǎng)嘉賓、北京大學(xué)心理學(xué)系教授魏坤琳認(rèn)為,人的面貌在成長(zhǎng)過程中受很多因素的影響,兒童時(shí)期的面部特征隨時(shí)間而改變,甚至有些特征會(huì)消失。從機(jī)器和人類對(duì)圖像感知來看,機(jī)器似乎更不占優(yōu)勢(shì)。的確,人類經(jīng)過幾百萬年的進(jìn)化,能夠在聽覺、視覺上做的很好。而人工智能誕生才60年,相對(duì)而言,語音識(shí)別、圖像識(shí)別對(duì)機(jī)器來說更難。
百度首席科學(xué)家吳恩達(dá)則表示,這次人機(jī)大戰(zhàn),是頂級(jí)的人臉識(shí)別選手和擅長(zhǎng)棋類游戲的人工智能比拼。人臉識(shí)別技術(shù)不同于一般的圖像識(shí)別,人臉本身太相似,不易區(qū)分;其次表情、光照條件、整容等外因會(huì)增加識(shí)別難度。而賽場(chǎng)上意外出現(xiàn)了雙胞胎,無疑更增加了辨認(rèn)難度,因?yàn)殡p胞胎骨骼太相似,導(dǎo)致差別特別細(xì)微,所以取的面部骨骼點(diǎn)不夠多的話是識(shí)別不出來。
百度深度學(xué)習(xí)實(shí)驗(yàn)室主任林元慶指出,百度這幾年在人工智能上投入了相當(dāng)?shù)牧α俊_@次人機(jī)大戰(zhàn)是以實(shí)戰(zhàn)的方式來,來檢驗(yàn)百度人工智能和人類差距。但是,打敗人類并不是參賽的目的,而是希望在此過程中不斷進(jìn)步,演化出很好的技術(shù)來服務(wù)人類。
此前,百度董事長(zhǎng)兼CEO李彥宏也在《最強(qiáng)大腦》第四季預(yù)告片中表示,如果最強(qiáng)大腦代表人類腦力的極限,那么百度大腦代表人工智能的最高水平。無論輸贏,都會(huì)對(duì)人工智能的技術(shù)發(fā)展做出突破性的貢獻(xiàn)。
1月6日當(dāng)天,百度大腦還同步宣布了多項(xiàng)技術(shù)開放的決定。百度大腦將全新開放十二項(xiàng)場(chǎng)景化技術(shù)服務(wù),將基于圖像、語音、自然語言、用戶畫像、機(jī)器學(xué)習(xí)、AR增強(qiáng)現(xiàn)實(shí)等領(lǐng)域的能力,面向不同行業(yè)定制的四大解決方案,全部對(duì)外共享。開發(fā)者只要訪問百度大腦官網(wǎng)(ai.baidu.com),即可通過開放接口進(jìn)行接入。
據(jù)了解,小度在即將舉行的《最強(qiáng)大腦》第四季第二場(chǎng)比賽中將和名人堂選手在聲音識(shí)別領(lǐng)域進(jìn)行較量。和圖像識(shí)別類似,機(jī)器識(shí)別聲音的難度大于人類。人類能否扳回一局,讓我們拭目以待。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。