科技行者 2月26日 北京消息(文/周雅):今日,搜狗公司舉辦了一場線上發(fā)布會(huì),正式發(fā)布S1、E1兩款A(yù)I錄音筆新品,其中S1售價(jià)2698元,E1售價(jià)1298元,即日起在京東天貓首發(fā)銷售,且同步發(fā)售兩款與故宮宮廷文化合作推出的故宮宮廷聯(lián)名款。
提起搜狗,人們的印象大多是「輸入法」以及「搜索引擎」,但基于此,這家公司正在布局 "以語言為核心的 AI 戰(zhàn)略",搜狗創(chuàng)始人兼CEO王小川曾經(jīng)在2019中國企業(yè)領(lǐng)袖年會(huì)上,分享了他對語言AI的觀察。
王小川稱,未來的語音人工智能硬件產(chǎn)品將有兩大發(fā)展趨勢,一是從固定設(shè)備走向移動(dòng)化、便攜化和可穿戴化;第二是IO(輸入和輸出)導(dǎo)向,即通過麥克風(fēng)、各種傳感器、GPS、磁力計(jì)等,從環(huán)境當(dāng)中捕獲更多的數(shù)據(jù),逐步從人適應(yīng)機(jī)器走向機(jī)器適應(yīng)人。
基于這兩大趨勢,王小川直言,“搜狗的目標(biāo),是做語言人工智能領(lǐng)域的引領(lǐng)者。”“語言是人工智能皇冠上的明珠。”王小川說,“甚至我們可以說沒有語言,我們就沒有能力去做創(chuàng)造力和推理的能力。今天人工智能大家認(rèn)為它能解決重復(fù)性的事情,就是因?yàn)槿斯ぶ悄苓€沒有創(chuàng)造力和推理能力,就是因?yàn)閷φZ言沒有充分的理解,這就是我們要理解的問題。”
自2012年起,搜狗就圍繞著自然交互和知識(shí)計(jì)算去發(fā)展核心的語言AI能力,近一年,搜狗在錄音筆方面頻頻落子。
2019 年 3 月,搜狗推出 AI 錄音筆 C1,據(jù)官方稱,C1首創(chuàng)集雙麥陣列、實(shí)時(shí)轉(zhuǎn)寫、云端分享等功能于一體的 AI 錄音筆 " 新形態(tài) ",上市至今一直在多個(gè)主流電商平臺(tái)保持 " 單品總銷量第一 " 的成績,其后推出的升級版 C1 Pro 也飽受好評。
除了產(chǎn)品本身,2019 年 8 月,搜狗還聯(lián)合愛國者、Newmine 紐曼、索尼錄音筆、萬城集團(tuán)四家行業(yè)企業(yè),成立 AI 創(chuàng)新聯(lián)盟,并宣布面向全行業(yè)開放聽寫服務(wù),利用自身 AI 技術(shù),為合作伙伴賦能。
以 AI 技術(shù),推動(dòng)傳統(tǒng)錄音筆行業(yè)轉(zhuǎn)型升級,既是跨界也是創(chuàng)新,讓錄音筆這個(gè)多年沒有什么新氣象的行業(yè),有了新的玩法。在此過程中,搜狗不僅開拓了 "AI 錄音筆 " 這一品類,并且通過開放聽寫服務(wù)、建立 AI 創(chuàng)新聯(lián)盟,從產(chǎn)品、技術(shù)與產(chǎn)業(yè)鏈三個(gè)方向,帶動(dòng)錄音筆行業(yè)成功完成了產(chǎn)業(yè)升級。
AI錄音筆還能怎么玩?
AI錄音筆怎么玩,搜狗認(rèn)為,它可以是一個(gè)集語音、轉(zhuǎn)寫、編輯、存儲(chǔ)和分享于一體的信息獲取工具。而S1和E1做到了語音、轉(zhuǎn)寫、編輯、存儲(chǔ)、分享和翻譯功能。
但無論如何,既然是錄音筆,“錄音”就是最基礎(chǔ)的功能,而優(yōu)秀的拾音能力,從根本上決定著一款錄音筆的市場表現(xiàn)和生命力。具體到新品,S1具備AI降噪功能,它采用的pureVoice AI降噪算法,可過濾4萬余種真實(shí)噪音,讓人聲收錄更清晰。從產(chǎn)品介紹來看,它不僅配備了2顆哈曼指向性麥克風(fēng),最遠(yuǎn)拾音距離可達(dá)10米,還配備有6顆全向麥克風(fēng),支持360°全向拾音。同時(shí)基于搜狗領(lǐng)先的clairVoice 8麥陣列算法,S1能夠?yàn)橛脩魩沓h(yuǎn)場景且360°無死角的拾音體驗(yàn)。
除了錄音問題,更多人在意的是,錄音之后的速記整理問題。傳統(tǒng)錄音筆在錄音之后需要反復(fù)聽寫,過程既耗時(shí)又枯燥,若碰到記憶或口音問題,更讓人頭疼,而S1和E1的轉(zhuǎn)寫功能很好地解決了這些問題。在支持錄音實(shí)時(shí)轉(zhuǎn)文字、錄音文件轉(zhuǎn)文字的同時(shí),還具備增強(qiáng)識(shí)別能力,可識(shí)別不同講話人,掌聲,笑聲等,做到準(zhǔn)確分辨準(zhǔn)確轉(zhuǎn)寫。
另外,兩款AI錄音筆均支持搜狗輸入法詞庫同步,均支持中英日韓德等10種語言、川粵津陜貴等10種方言的錄音和轉(zhuǎn)寫,此外,搜狗語音團(tuán)隊(duì)經(jīng)過長時(shí)間訓(xùn)練,所創(chuàng)建的財(cái)經(jīng)貿(mào)易、醫(yī)療衛(wèi)生、IT科技、政法、文化體育等5個(gè)專業(yè)領(lǐng)域的語言模型,也應(yīng)用到了此次的新品當(dāng)中,以提升行業(yè)特有詞匯的識(shí)別準(zhǔn)確率。
搜狗表示,“兩款產(chǎn)品的轉(zhuǎn)寫準(zhǔn)確率均高達(dá)98%。”
搜狗認(rèn)為,如果說超強(qiáng)識(shí)音是AI錄音筆的基礎(chǔ)項(xiàng),準(zhǔn)確轉(zhuǎn)寫是AI錄音筆的核心項(xiàng),那么高效整理就是AI錄音筆的加分項(xiàng)。在這一方面,S1與E1采用“業(yè)內(nèi)首創(chuàng)的”NLP引擎智能摘要技術(shù),可通過智能語義組織段落,自動(dòng)提煉關(guān)鍵字形成標(biāo)簽,智能提取段落摘要,方便用戶整理,還可以用語音一句話查找錄音內(nèi)容,同時(shí)可基于用戶的錄音標(biāo)記、錄音中的掌聲、笑聲等節(jié)點(diǎn)提取內(nèi)容重點(diǎn)并進(jìn)行匯總。基于云端存儲(chǔ)技術(shù),用戶還能在錄音筆、手機(jī) APP、網(wǎng)頁、PC 客戶端等,自動(dòng)同步和管理錄音數(shù)據(jù),并實(shí)現(xiàn)一鍵導(dǎo)出、掃碼分享等便捷操作。
除了拾音、轉(zhuǎn)寫、整理之外,S1與E1帶來的額外“驚喜”,無疑是它們的翻譯能力,是“業(yè)內(nèi)首個(gè)”支持個(gè)人同傳功能的錄音筆,支持實(shí)時(shí)中英互譯,還支持微信小程序多人接入、共享翻譯內(nèi)容。S1支持全球200個(gè)國家63種語言的在線翻譯,以及中、英、日、韓、法、俄等9種常用語言的離線翻譯,其“行業(yè)首創(chuàng)的”自由對話翻譯功能,可實(shí)現(xiàn)多場景下的自在交流。
圖為搜狗AI錄音筆歷代產(chǎn)品參數(shù)
好文章,需要你的鼓勵(lì)
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。