曾幾何時,在孩子們的童年還沒有被各類智能手機和電腦游戲所占領的年代,父母和長輩們會不時興致勃勃地把尚且年幼的孩子叫到跟前,出一些字謎讓他們猜,而后饒有興致地分享各類字謎的解法。隨著時代的車輪不斷向前,猜字謎這項有趣的中國傳統(tǒng)民間文化逐漸消失在了人們的視野中。現(xiàn)在,我們很難有機會在除了元宵節(jié)之外的日子體驗猜字謎游戲的樂趣。即便能夠體驗,現(xiàn)代的青年人恐怕在面對各類字謎時,也會顯得無從下手吧。
元宵節(jié)當天,微軟亞洲研究院在已有的微軟對聯(lián)平臺上推出了一個新功能——微軟猜字謎。當用戶輸入謎面后,系統(tǒng)自動分析謎面,而后迅速給出謎底。更有趣的是,這款系統(tǒng)還可以為用戶自動生成謎面。當用戶輸入謎底(單個字)后,系統(tǒng)可自動生成若干謎面供用戶選擇。
字謎是中國文化獨有的內(nèi)容,是以一個或幾個漢字為謎底的謎語。這種謎語的編寫或是利用了漢字的造字規(guī)律,或是利用了漢字形、音、義某一方面的特點,既有趣味,又有知識內(nèi)涵。根據(jù)謎面的不同,字謎可分為:字形謎、字義謎、典故謎等多個類別。由于中國字義謎和典故謎的構成更為復雜,此次微軟亞洲研究院推出的計算機自動猜字謎系統(tǒng)主要針對的是字形謎,即謎面是根據(jù)謎底(一個字)的字形而設計的。
這款字謎系統(tǒng)由微軟亞洲研究院自然語言計算組開發(fā),耗時四個月。開發(fā)這樣一個系統(tǒng),研究人員需要首先進行大量的數(shù)據(jù)挖掘工作,并從收集到的大量字謎中挑選出字形謎。而后建模,用統(tǒng)計機器學習的方法對模型進行訓練,得到一個能將各類自然語言描述轉化為特定偏旁部首的優(yōu)化模型。最后,將得出的各類偏旁部首映射到有可能的字,即謎底。在這款字謎系統(tǒng)的頁面中,我們不僅在輸入字形謎的謎面后可以看到最佳答案,而且還可以看到推理的過程,這對于猜字謎的思維訓練是非常有幫助的。
自然語言計算組負責人,微軟亞洲研究院首席研究員周明是機器翻譯和自然語言處理等領域的專家,曾主導了微軟對聯(lián)系統(tǒng)的開發(fā)。他表示:”猜字謎是在微軟對聯(lián)系統(tǒng)之后,我們對人工智能的又一個有意義的嘗試。這些創(chuàng)新集中體現(xiàn)了NLP 2.0的戰(zhàn)略思想,即對基于互聯(lián)網(wǎng)的平臺,對大數(shù)據(jù)進行搜集、利用統(tǒng)計機器學習方法自動學習建立智能模型、然后快速上線獲得用戶反饋從而把用戶引入到創(chuàng)新的過程之中。猜字謎系統(tǒng)的水平也會不斷提升“。
當然,推出這款基于字形謎的計算機自動猜字謎系統(tǒng)僅僅是個開始,微軟亞洲研究院的研究員們還將繼續(xù)深入研究,推出包括更多類型的字謎系統(tǒng),以及擴展到字謎之外的其他類型的謎語。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。