曾幾何時(shí),在孩子們的童年還沒有被各類智能手機(jī)和電腦游戲所占領(lǐng)的年代,父母和長輩們會(huì)不時(shí)興致勃勃地把尚且年幼的孩子叫到跟前,出一些字謎讓他們猜,而后饒有興致地分享各類字謎的解法。隨著時(shí)代的車輪不斷向前,猜字謎這項(xiàng)有趣的中國傳統(tǒng)民間文化逐漸消失在了人們的視野中?,F(xiàn)在,我們很難有機(jī)會(huì)在除了元宵節(jié)之外的日子體驗(yàn)猜字謎游戲的樂趣。即便能夠體驗(yàn),現(xiàn)代的青年人恐怕在面對(duì)各類字謎時(shí),也會(huì)顯得無從下手吧。
元宵節(jié)當(dāng)天,微軟亞洲研究院在已有的微軟對(duì)聯(lián)平臺(tái)上推出了一個(gè)新功能——微軟猜字謎。當(dāng)用戶輸入謎面后,系統(tǒng)自動(dòng)分析謎面,而后迅速給出謎底。更有趣的是,這款系統(tǒng)還可以為用戶自動(dòng)生成謎面。當(dāng)用戶輸入謎底(單個(gè)字)后,系統(tǒng)可自動(dòng)生成若干謎面供用戶選擇。
字謎是中國文化獨(dú)有的內(nèi)容,是以一個(gè)或幾個(gè)漢字為謎底的謎語。這種謎語的編寫或是利用了漢字的造字規(guī)律,或是利用了漢字形、音、義某一方面的特點(diǎn),既有趣味,又有知識(shí)內(nèi)涵。根據(jù)謎面的不同,字謎可分為:字形謎、字義謎、典故謎等多個(gè)類別。由于中國字義謎和典故謎的構(gòu)成更為復(fù)雜,此次微軟亞洲研究院推出的計(jì)算機(jī)自動(dòng)猜字謎系統(tǒng)主要針對(duì)的是字形謎,即謎面是根據(jù)謎底(一個(gè)字)的字形而設(shè)計(jì)的。
這款字謎系統(tǒng)由微軟亞洲研究院自然語言計(jì)算組開發(fā),耗時(shí)四個(gè)月。開發(fā)這樣一個(gè)系統(tǒng),研究人員需要首先進(jìn)行大量的數(shù)據(jù)挖掘工作,并從收集到的大量字謎中挑選出字形謎。而后建模,用統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法對(duì)模型進(jìn)行訓(xùn)練,得到一個(gè)能將各類自然語言描述轉(zhuǎn)化為特定偏旁部首的優(yōu)化模型。最后,將得出的各類偏旁部首映射到有可能的字,即謎底。在這款字謎系統(tǒng)的頁面中,我們不僅在輸入字形謎的謎面后可以看到最佳答案,而且還可以看到推理的過程,這對(duì)于猜字謎的思維訓(xùn)練是非常有幫助的。
自然語言計(jì)算組負(fù)責(zé)人,微軟亞洲研究院首席研究員周明是機(jī)器翻譯和自然語言處理等領(lǐng)域的專家,曾主導(dǎo)了微軟對(duì)聯(lián)系統(tǒng)的開發(fā)。他表示:”猜字謎是在微軟對(duì)聯(lián)系統(tǒng)之后,我們對(duì)人工智能的又一個(gè)有意義的嘗試。這些創(chuàng)新集中體現(xiàn)了NLP 2.0的戰(zhàn)略思想,即對(duì)基于互聯(lián)網(wǎng)的平臺(tái),對(duì)大數(shù)據(jù)進(jìn)行搜集、利用統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法自動(dòng)學(xué)習(xí)建立智能模型、然后快速上線獲得用戶反饋從而把用戶引入到創(chuàng)新的過程之中。猜字謎系統(tǒng)的水平也會(huì)不斷提升“。
當(dāng)然,推出這款基于字形謎的計(jì)算機(jī)自動(dòng)猜字謎系統(tǒng)僅僅是個(gè)開始,微軟亞洲研究院的研究員們還將繼續(xù)深入研究,推出包括更多類型的字謎系統(tǒng),以及擴(kuò)展到字謎之外的其他類型的謎語。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。