Cortana,這個(gè)女主持人,哦,準(zhǔn)確地說(shuō)應(yīng)該是這個(gè)私人助理,主持了正常Build2014大會(huì),她是微軟蓄謀已久的語(yǔ)音助理,準(zhǔn)確地是個(gè)人助理,她是微軟反擊移動(dòng)互聯(lián)網(wǎng)市場(chǎng)的重要里程碑。
在Build2014上,微軟發(fā)布了基于Windows Phone 8.1的語(yǔ)音助理Cortana,開(kāi)始正式向蘋(píng)果Siri和Google Now發(fā)出挑戰(zhàn)。
從現(xiàn)場(chǎng)的演示來(lái)看,微軟的Cortana比之前其集成在Windows 8之中的語(yǔ)音操作進(jìn)步了很多,之前版本是感覺(jué)更像是一個(gè)生硬的命令執(zhí)行者,而Cortana則更像是一個(gè)有了感情的私人助理,她除了完成指令之外,更懂得“主人”的使用習(xí)慣,甚至她懂得調(diào)侃,感覺(jué)這是一個(gè)更加高階的助理。
雖然,目前微軟Cortana是附著在Windows Phone 平臺(tái),但是整體來(lái)看,其對(duì)于Windows 系列產(chǎn)品以及微軟公司都有著重要意義。
一、微軟移動(dòng)端重要布局:PC上語(yǔ)音識(shí)別技術(shù)發(fā)展有幾十年了,而蘋(píng)果Siri和Google Now算是亮點(diǎn),微軟Cortana問(wèn)世預(yù)示這一市場(chǎng)競(jìng)爭(zhēng)更具白熱化,這也是微軟在移動(dòng)互聯(lián)網(wǎng)時(shí)代的重要布局之一;
二、人機(jī)交互的新陣地:語(yǔ)音識(shí)別技術(shù)也將是未來(lái)多年來(lái)競(jìng)爭(zhēng)的熱點(diǎn),隨著識(shí)別率的提高,語(yǔ)音將成為人機(jī)交互將成為熱點(diǎn)。之前,微軟體感計(jì)算方面有著不錯(cuò)的表現(xiàn),語(yǔ)音識(shí)別將進(jìn)一步展現(xiàn)微軟的實(shí)力;
三、展示全面實(shí)力:相比之下,目前Cortana比蘋(píng)果Siri和Google Now更好玩,為什么?這是因?yàn)樗贐ing搜索,因?yàn)锽ing有著眾多的合作伙伴,因而Cortana可以提供更豐富的服務(wù)。另外,Cortana將進(jìn)一步展現(xiàn)微軟的云計(jì)算和大數(shù)據(jù)方面的實(shí)力;
四、微軟的轉(zhuǎn)折點(diǎn):雖然目前Cortana是Windows Phone 8.1的重要功能之一,但是相信隨著技術(shù)的成熟,其將進(jìn)一步覆蓋到微軟的所有平臺(tái)。在Build2014上,微軟已經(jīng)顯露出了打造統(tǒng)一平臺(tái)的信心和決心,未來(lái)智能手機(jī)、平板電腦、PC以及游戲主機(jī)都將給予同一個(gè)平臺(tái),Cortana將是統(tǒng)一平臺(tái)之上的一個(gè)重要入口。
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開(kāi)發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺(jué)解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺(jué)語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺(jué)信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。