教師在課堂上教小學(xué)生們使用平板電腦(圖:GETTY)
AI技術(shù)如何更好地在教育和娛樂領(lǐng)域發(fā)揮作用?原帖發(fā)布在知識(shí)普及與分享論壇Quora上,下面來看專業(yè)人士給出的答案。
回答者為Patricia Scanlon博士,SoapBox Labs創(chuàng)始人:
說起孩子和科技的交集,大多數(shù)討論都集中在“孩子每天看幾個(gè)小時(shí)屏幕”或者“孩子們到底該不該接觸科技”等等。但也許真正重要的問題應(yīng)該是——科技能夠?yàn)閷W(xué)生們的學(xué)習(xí)和娛樂生活帶來哪些獨(dú)特的助益?我們又該如何實(shí)現(xiàn)這些助益?
語音識(shí)別是一種AI技術(shù),可以通過語音為孩子們提供許多獨(dú)一無二的學(xué)習(xí)和娛樂體驗(yàn)。就個(gè)人來看,我覺得這是個(gè)獨(dú)特的機(jī)會(huì),有望使用語音識(shí)別為所有年齡段和學(xué)習(xí)階段
的孩子們提供更強(qiáng)大、更快樂也更加身臨其境的體驗(yàn)。而且這種體驗(yàn)是他們?cè)谄渌麍?chǎng)景中所享受不到的。
下面僅舉幾例:
1.閱讀:語音閱讀工具能夠在孩子學(xué)會(huì)閱讀、識(shí)字或者說話之前幫助他們盡快跨過閱讀門檻,提前消解掉相當(dāng)一部分閱讀障礙問題。而當(dāng)孩子們真正接觸書籍時(shí),支持語音的閱讀應(yīng)用還能在過程中傾聽、提示、糾正并鼓勵(lì)他們把握文中含義,如同身邊始終伴有一位耐心的成年指導(dǎo)者。
支持語音的閱讀應(yīng)用能夠即時(shí)準(zhǔn)確地提供反饋信息,幫助孩子自主進(jìn)步、定期練習(xí)、評(píng)估自己的閱讀能力并發(fā)現(xiàn)需要改進(jìn)的方面。支持語音的閱讀評(píng)估系統(tǒng)則即時(shí)幫助教育工作者和家長(zhǎng)及時(shí)了解孩子對(duì)哪部分內(nèi)容理解不到位,并幫助他們以更加個(gè)性化的方式支持孩子們達(dá)成閱讀目標(biāo)。
2.語言學(xué)習(xí):評(píng)估工具可以聆聽孩子們的朗讀語音,并立即返回發(fā)音得分與鼓勵(lì)反饋,整個(gè)體驗(yàn)與家長(zhǎng)或教師的陪伴非常相似。以面向2到6歲兒童的英語學(xué)習(xí)平臺(tái)Lingumi為例,它就把專為兒童設(shè)計(jì)的語音識(shí)別技術(shù)嵌入到應(yīng)用之內(nèi),使其能夠在兒童朗讀口語練習(xí)時(shí)認(rèn)真“傾聽”,之后根據(jù)發(fā)音是否標(biāo)準(zhǔn)、朗讀是否流利等指標(biāo)如同經(jīng)驗(yàn)豐富的語言教師那樣給出準(zhǔn)確的即時(shí)反饋意見。
3.數(shù)學(xué):尚不識(shí)字的孩子們也可以使用支持語音功能的應(yīng)用,幫助他們?cè)谡J(rèn)識(shí)數(shù)字之前就初步理解這些符號(hào)背后的抽象概念。支持語音的應(yīng)用能讓整個(gè)數(shù)學(xué)學(xué)習(xí)體驗(yàn)變得更有趣、互動(dòng)性更強(qiáng)。這些應(yīng)用提供的課程內(nèi)容也會(huì)隨著孩子的成長(zhǎng)和數(shù)學(xué)技能的加深而不斷調(diào)整。
我們可以設(shè)想一位6歲的孩子在家中第一次接觸數(shù)學(xué):應(yīng)用會(huì)向他們展示一張包含5個(gè)蘋果的圖片,并問孩子“你能看到多少個(gè)蘋果?”孩子脫口而出“5個(gè)!”應(yīng)用會(huì)返回正確的語音提示,并進(jìn)一步發(fā)問“如果你吃掉3個(gè),還剩幾個(gè)?”孩子則叫道“2個(gè)!”孩子答對(duì)的問題越多,應(yīng)用后續(xù)提出的問題就越難。如果孩子回答錯(cuò)誤,應(yīng)用則會(huì)在提示之后鼓勵(lì)對(duì)方嘗試再次作答。
4.交互式電視:如今的兒童向劇集和電影固然有趣,但本質(zhì)上仍然只是一段被動(dòng)的單向體驗(yàn)。孩子雖然喜歡愛探險(xiǎn)的朵拉,但永遠(yuǎn)無法與她交談并幫助她探索叢林。而語音功能的加入將徹底顛覆傳統(tǒng)娛樂范式。
未來的電視和電影可能提供諸多分支,孩子可以在其中引導(dǎo)自己最喜愛的角色并選擇他們接下來要去哪里一探究竟。交互式電視讓孩子們有機(jī)會(huì)享受到每次不同的探險(xiǎn)開端、中段與結(jié)尾。只要喊出自己的選擇,孩子們就能在自己喜歡的節(jié)目中隨時(shí)開啟一段新的旅程。當(dāng)然,這只是我對(duì)于未來交互式電視觀看體驗(yàn)的一種暢想,但我真心希望自己的孩子能夠擁有這樣美好的童年經(jīng)歷。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。