CNET科技資訊網 1月6日 北京消息: 1月6日晚21點10分,江蘇衛(wèi)視《最強大腦》第四季震撼來襲。這一季的節(jié)目,除了有往期如云高手的對決,更有代表著中國人工智能最高水平的“百度大腦”現場挑戰(zhàn)名人堂選手的“最強大腦”,在圖像和語音識別等領域一決高下,上演一場“與未來相見”的巔峰對決。
在人工智能發(fā)展史上的數次人機交鋒中,人機雙方比拼的重點通常圍繞記憶、邏輯、運算等方面展開,機器通過學習可以取得顯而易見的進步,甚至于實現戰(zhàn)勝人類。而百度大腦參與的這次人機PK,機器則面臨著全新的挑戰(zhàn),與它競技的是人類通過幾百萬年的進化才取得的聽覺、視覺等天賦。人可以通過直覺來進行很好地判斷,比如見到一個人,你不假思索就能認出他是誰。在對戰(zhàn)中,百度大腦需要通過大量計算來彌補人類的這種直覺。這對于機器來說是個巨大的挑戰(zhàn)。
不過,百度大腦經過幾年的“刻苦學習”,已經在圖像和語音識別上取得了很大的突破。以人臉識別為例,百度基于深度神經網絡機器學習算法對檢測到的多個人臉面部特征點進行學習、識別,人臉識別準確率達到了99.77%。此前,人臉識別在2016年烏鎮(zhèn)世界互聯網大會上牛刀小試,用戶只要在首次入園時提供身份證掃描并錄入一張實時拍攝照片,總共耗時不超過10 秒,之后就可以“刷臉”在烏鎮(zhèn)景區(qū)各處閘機處通行。據百度深度學習實驗室主任林元慶透露,此次為參加《最強大腦》的人臉識別對決,百度大腦更是積極備戰(zhàn),對2百萬人的2億張照片進行了持續(xù)學習。
《最強大腦》的名人堂選手一向以驍勇善戰(zhàn)著稱,第一期節(jié)目在人臉識別的對決中,名人堂就將派出王峰、李威和鄭才千等頂尖高手迎戰(zhàn),其中,王峰是19年來世界腦力錦標賽上第一個獲得個人總冠軍的亞洲人,曾獲得2010年世界腦力錦標賽總冠軍。而“超級變臉王”李威、“魔方墻找茬王”鄭才千更是人臉識別和圖像識別領域的頂尖高手,都曾在世界賽事上摘得桂冠。首戰(zhàn)迎來如此強勁的對手,讓大家也不禁為小度機器人捏了把冷汗。
人機對決即將拉開帷幕,百度大腦和最強人類大腦都已經做好準備,這場世紀大戰(zhàn),是人類成功捍衛(wèi)自己的榮譽,還是百度大腦突破此前認為的不可能,在非計算領域再次登頂?讓我們拭目以待。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數學推理能力提升8.6%,通用推理提升8.4%,且無需任何數學題目作為訓練材料。研究發(fā)現游戲中的三種推理模式能成功轉移到數學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數學優(yōu)化方法,在合成數據集上實現37.9%的精度提升,并在真實設備上展現出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現,經過強化學習訓練的視覺語言模型雖然表現出"頓悟時刻"現象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯合提出SparseLoRA技術,通過動態(tài)稀疏性實現大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。