教師在課堂上教小學(xué)生們使用平板電腦(圖:GETTY)
AI技術(shù)如何更好地在教育和娛樂領(lǐng)域發(fā)揮作用?原帖發(fā)布在知識(shí)普及與分享論壇Quora上,下面來看專業(yè)人士給出的答案。
回答者為Patricia Scanlon博士,SoapBox Labs創(chuàng)始人:
說起孩子和科技的交集,大多數(shù)討論都集中在“孩子每天看幾個(gè)小時(shí)屏幕”或者“孩子們到底該不該接觸科技”等等。但也許真正重要的問題應(yīng)該是——科技能夠?yàn)閷W(xué)生們的學(xué)習(xí)和娛樂生活帶來哪些獨(dú)特的助益?我們又該如何實(shí)現(xiàn)這些助益?
語音識(shí)別是一種AI技術(shù),可以通過語音為孩子們提供許多獨(dú)一無二的學(xué)習(xí)和娛樂體驗(yàn)。就個(gè)人來看,我覺得這是個(gè)獨(dú)特的機(jī)會(huì),有望使用語音識(shí)別為所有年齡段和學(xué)習(xí)階段
的孩子們提供更強(qiáng)大、更快樂也更加身臨其境的體驗(yàn)。而且這種體驗(yàn)是他們?cè)谄渌麍鼍爸兴硎懿坏降摹?/p>
下面僅舉幾例:
1.閱讀:語音閱讀工具能夠在孩子學(xué)會(huì)閱讀、識(shí)字或者說話之前幫助他們盡快跨過閱讀門檻,提前消解掉相當(dāng)一部分閱讀障礙問題。而當(dāng)孩子們真正接觸書籍時(shí),支持語音的閱讀應(yīng)用還能在過程中傾聽、提示、糾正并鼓勵(lì)他們把握文中含義,如同身邊始終伴有一位耐心的成年指導(dǎo)者。
支持語音的閱讀應(yīng)用能夠即時(shí)準(zhǔn)確地提供反饋信息,幫助孩子自主進(jìn)步、定期練習(xí)、評(píng)估自己的閱讀能力并發(fā)現(xiàn)需要改進(jìn)的方面。支持語音的閱讀評(píng)估系統(tǒng)則即時(shí)幫助教育工作者和家長及時(shí)了解孩子對(duì)哪部分內(nèi)容理解不到位,并幫助他們以更加個(gè)性化的方式支持孩子們達(dá)成閱讀目標(biāo)。
2.語言學(xué)習(xí):評(píng)估工具可以聆聽孩子們的朗讀語音,并立即返回發(fā)音得分與鼓勵(lì)反饋,整個(gè)體驗(yàn)與家長或教師的陪伴非常相似。以面向2到6歲兒童的英語學(xué)習(xí)平臺(tái)Lingumi為例,它就把專為兒童設(shè)計(jì)的語音識(shí)別技術(shù)嵌入到應(yīng)用之內(nèi),使其能夠在兒童朗讀口語練習(xí)時(shí)認(rèn)真“傾聽”,之后根據(jù)發(fā)音是否標(biāo)準(zhǔn)、朗讀是否流利等指標(biāo)如同經(jīng)驗(yàn)豐富的語言教師那樣給出準(zhǔn)確的即時(shí)反饋意見。
3.數(shù)學(xué):尚不識(shí)字的孩子們也可以使用支持語音功能的應(yīng)用,幫助他們?cè)谡J(rèn)識(shí)數(shù)字之前就初步理解這些符號(hào)背后的抽象概念。支持語音的應(yīng)用能讓整個(gè)數(shù)學(xué)學(xué)習(xí)體驗(yàn)變得更有趣、互動(dòng)性更強(qiáng)。這些應(yīng)用提供的課程內(nèi)容也會(huì)隨著孩子的成長和數(shù)學(xué)技能的加深而不斷調(diào)整。
我們可以設(shè)想一位6歲的孩子在家中第一次接觸數(shù)學(xué):應(yīng)用會(huì)向他們展示一張包含5個(gè)蘋果的圖片,并問孩子“你能看到多少個(gè)蘋果?”孩子脫口而出“5個(gè)!”應(yīng)用會(huì)返回正確的語音提示,并進(jìn)一步發(fā)問“如果你吃掉3個(gè),還剩幾個(gè)?”孩子則叫道“2個(gè)!”孩子答對(duì)的問題越多,應(yīng)用后續(xù)提出的問題就越難。如果孩子回答錯(cuò)誤,應(yīng)用則會(huì)在提示之后鼓勵(lì)對(duì)方嘗試再次作答。
4.交互式電視:如今的兒童向劇集和電影固然有趣,但本質(zhì)上仍然只是一段被動(dòng)的單向體驗(yàn)。孩子雖然喜歡愛探險(xiǎn)的朵拉,但永遠(yuǎn)無法與她交談并幫助她探索叢林。而語音功能的加入將徹底顛覆傳統(tǒng)娛樂范式。
未來的電視和電影可能提供諸多分支,孩子可以在其中引導(dǎo)自己最喜愛的角色并選擇他們接下來要去哪里一探究竟。交互式電視讓孩子們有機(jī)會(huì)享受到每次不同的探險(xiǎn)開端、中段與結(jié)尾。只要喊出自己的選擇,孩子們就能在自己喜歡的節(jié)目中隨時(shí)開啟一段新的旅程。當(dāng)然,這只是我對(duì)于未來交互式電視觀看體驗(yàn)的一種暢想,但我真心希望自己的孩子能夠擁有這樣美好的童年經(jīng)歷。
好文章,需要你的鼓勵(lì)
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對(duì)弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。