科技行者 9月19日 北京消息: 9月19日,百度地圖在“‘音’為有你,更有‘AI’”發(fā)布會(huì)上正式發(fā)布“語音定制功能”,內(nèi)部代號(hào)“百雀靈”。它是全球首個(gè)地圖語音定制產(chǎn)品。用戶只需在百度地圖App上錄制20句話,20分鐘左右即可生成個(gè)人完整語音包,為即將到來的國慶出行帶來前所未有的新鮮體驗(yàn)。
“百度地圖的工程師們內(nèi)部叫它‘百雀靈’,百雀是大自然中各種鳥兒的總稱,它們有各種美妙好聽的聲音,‘百雀靈’寓意著千千萬萬的用戶,都能在百度地圖錄制自己的語音包,用自己獨(dú)特的聲音,向所愛的人表達(dá)關(guān)心與陪伴。”百度地圖事業(yè)部總經(jīng)理李瑩表示:“語音定制功能是AI賦能百度地圖的又一力作,我們希望這一次語音技術(shù)與百度地圖的融合,能夠釋放科技力量,讓每個(gè)人都感受到科技進(jìn)步帶來的改變和情懷。”
(百度地圖事業(yè)部總經(jīng)理李瑩)
定制專屬語音包的流程十分簡(jiǎn)單,只需打開百度地圖App,喚醒“小度小度”后說“錄制我的語音”,或點(diǎn)擊百度地圖首頁的“出行助手”后進(jìn)入“語音定制”,便可開啟語音定制之旅。在安靜的環(huán)境中,只要跟著百度地圖的指引,念出卡通和影視臺(tái)詞等充滿趣味性的錄制文本,等待20分鐘左右,就能擁有一個(gè)自己專屬的語音包,并在百度地圖的景區(qū)智能語音導(dǎo)覽、智能語音交互、導(dǎo)航等全部場(chǎng)景使用,大家可免費(fèi)使用自己或家人的語音包暢游景區(qū)聽播報(bào)。此外,錄制的個(gè)人語音包還可以分享給親朋好友,無論是思念游子的父母、還是異地的戀人都能通過地圖語音包與親人更“近”一步。用戶的“人氣”語音包還有機(jī)會(huì)獲得百度地圖官方推薦,成為地圖“好聲音”。
(喊“小度小度”開啟語音包錄制)
過去,制作地圖語音包需要在專業(yè)錄音棚錄制大量語料,再經(jīng)過長達(dá)數(shù)月的制作才能生成,流程復(fù)雜、耗時(shí)長,讓地圖語音包只是“明星專屬”?,F(xiàn)在,有了百度地圖的語音定制功能,人人都可以是“大明星”。
隨著語音定制功能的上線,百度地圖“銀河計(jì)劃”也正式啟動(dòng),首期邀請(qǐng)到華晨宇、秦嵐等當(dāng)紅藝人參與個(gè)人語音包錄制,成為百度地圖“明星導(dǎo)航員”,讓用戶的每一次出行新鮮感十足。“銀河計(jì)劃”的發(fā)布意味著明星語音包錄制的門檻被大大降低,并且人人都可錄制明星品質(zhì)的語音包,浩如星瀚,給人無限遐想。
百度地圖語音定制功能背后,是百度大腦語音技術(shù)的賦能。AI技術(shù)的加持讓地圖語音包生產(chǎn)實(shí)現(xiàn)了從月級(jí)別到分鐘級(jí)別的突破性進(jìn)展,也重新定義了語音包的生產(chǎn)模式。
百度語音首席架構(gòu)師賈磊在發(fā)布會(huì)現(xiàn)場(chǎng)揭秘了背后的技術(shù):“百度地圖語音定制功能基于百度獨(dú)創(chuàng)的說話人韻律遷移技術(shù)Meitron,其特點(diǎn)主要體現(xiàn)在發(fā)音人音色轉(zhuǎn)換,多情感朗讀和韻律風(fēng)格遷移三個(gè)方面,從而讓個(gè)性化語音合成的定制門檻大大降低,相信百度語音技術(shù)在AI時(shí)代擁有無限可能”。
(百度語音首席架構(gòu)師賈磊)
很多家長想給自家萌寶錄制語音包,但又不免會(huì)擔(dān)心萌寶有發(fā)音不清晰、停頓不規(guī)律、普通話不標(biāo)準(zhǔn)的情況,百度地圖語音定制功能也克服了這類問題,實(shí)現(xiàn)了兒童音的完美合成。當(dāng)天,百度地圖與寶寶巴士發(fā)起“快樂啟蒙 安全出發(fā)”倡議,上線“奇奇妙妙”語音包,通過此類卡通語音包幫助家長在駕車出行場(chǎng)景中安撫寶寶的情緒,為出行安全保駕護(hù)航。
對(duì)于用戶非常關(guān)心的音頻數(shù)據(jù)安全問題,百度地圖表示,百度地圖對(duì)于語音定制服務(wù)的權(quán)限獲取將僅用作語音包錄制,不做他用。百度地圖未經(jīng)用戶的授權(quán)同意,不會(huì)將用戶的語音包共享給任何人。
在AI技術(shù)的深度加持下,新一代人工智能地圖——百度地圖持續(xù)創(chuàng)新和領(lǐng)先。未來,百度地圖還將繼續(xù)加速,為用戶提供更加安全、智能、高效的出行服務(wù)。這個(gè)十一黃金周,帶上自己的專屬語音包、帶上人工智能地圖出發(fā)吧!
好文章,需要你的鼓勵(lì)
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對(duì)弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。