自然語言理解(NLP)素有“人工智能皇冠上的明珠”盛譽(yù),這也意味著語言與知識(shí)等認(rèn)知層面的技術(shù)突破將進(jìn)一步促進(jìn)AI深入發(fā)展。
8月25日,以“掌握知識(shí)、理解語言、擁有智能”為主題的百度大腦語言與知識(shí)技術(shù)峰會(huì)舉行,百度CTO王海峰發(fā)表主旨演講,解讀百度語言與知識(shí)技術(shù)的發(fā)展歷程與最新成果,與產(chǎn)學(xué)研各界分享技術(shù)及產(chǎn)業(yè)發(fā)展趨勢(shì)和展望,百度集團(tuán)副總裁吳甜和百度技術(shù)委員會(huì)主席吳華分別發(fā)布百度語言與知識(shí)技術(shù)系列產(chǎn)品和數(shù)據(jù)集共建計(jì)劃,重磅推出5款產(chǎn)品的新發(fā)布,全面加速AI技術(shù)大規(guī)模應(yīng)用。這是一場(chǎng)凝聚了百度在語言與知識(shí)領(lǐng)域十年技術(shù)積累和產(chǎn)業(yè)實(shí)踐的盛會(huì),必將帶來深遠(yuǎn)影響。
圖:百度CTO王海峰
十年:開拓者、深耕者、引領(lǐng)者
語言與知識(shí)技術(shù)是人工智能認(rèn)知能力的核心。2010年,百度成立自然語言處理部,在前瞻技術(shù)與產(chǎn)業(yè)格局上不斷引領(lǐng)、創(chuàng)新,十年間已成為中國NLP發(fā)展的一面旗幟。
峰會(huì)上,王海峰回顧,“在百度語言與知識(shí)技術(shù)的布局和發(fā)展中,我們始終在注意把握兩個(gè)趨勢(shì),即技術(shù)發(fā)展趨勢(shì)和產(chǎn)業(yè)發(fā)展趨勢(shì),并力爭(zhēng)引領(lǐng)趨勢(shì)。”
縱覽百度語言與知識(shí)技術(shù)發(fā)展歷程,從研究方法、研究對(duì)象、研究方向、產(chǎn)業(yè)應(yīng)用等各個(gè)層面,布局完整,不斷打磨成熟,始終與應(yīng)用的發(fā)展趨勢(shì)、需求一脈相承,與產(chǎn)業(yè)接軌。
十年來,百度大腦語言與知識(shí)技術(shù)成果豐碩,獲得包括國家科技進(jìn)步獎(jiǎng)在內(nèi)的20多個(gè)獎(jiǎng)項(xiàng),30多項(xiàng)國際競(jìng)賽冠軍,發(fā)表學(xué)術(shù)論文超過300篇,申請(qǐng)專利2000多項(xiàng)。技術(shù)不斷突破創(chuàng)新的同時(shí),也在產(chǎn)品上創(chuàng)新探索,同時(shí)將領(lǐng)先的技術(shù)輸出給開發(fā)者與合作伙伴,提升各行業(yè)智能化水平。
全面分享語言與知識(shí)技術(shù)成果
王海峰全面分享了百度語言與知識(shí)技術(shù)完整布局和最新成果。
首先,知識(shí)圖譜是機(jī)器認(rèn)知世界的重要基礎(chǔ),百度打造了世界上最大規(guī)模知識(shí)圖譜,擁有超過50億實(shí)體和5500億事實(shí),并在不斷演進(jìn)和更新。百度知識(shí)圖譜應(yīng)用于各行各業(yè),每天的調(diào)用次數(shù)超過400億次。
其次,在融入知識(shí)的基礎(chǔ)上,語言理解能力不斷增強(qiáng)。2019年3月,百度提出知識(shí)增強(qiáng)的語義理解框架ERNIE,在深度學(xué)習(xí)的基礎(chǔ)上融入知識(shí),同時(shí)具備持續(xù)學(xué)習(xí)能力,曾一舉登頂全球權(quán)威數(shù)據(jù)集GLUE榜單,首次突破90分大關(guān),刷新榜單歷史?;谥R(shí)圖譜和語義表示,突破了閱讀理解、對(duì)話理解以及跨模態(tài)深度語義理解等技術(shù)。
第三,語言生成是語言與知識(shí)技術(shù)中的重要組成部分?;陬A(yù)訓(xùn)練技術(shù)的成功經(jīng)驗(yàn),百度提出基于多流機(jī)制的語言生成預(yù)訓(xùn)練技術(shù),兼顧詞、短語等不同粒度的語義信息,顯著提升生成效果。百度也探索了多文檔摘要生成,通過圖結(jié)構(gòu)語義表示引入篇章知識(shí),在單文檔和多文檔摘要生成效果都有提升。
應(yīng)用系統(tǒng)層面,對(duì)話系統(tǒng)和機(jī)器翻譯等成績卓著。百度提出了知識(shí)圖譜驅(qū)動(dòng)的對(duì)話控制技術(shù),以及首個(gè)基于隱空間的大規(guī)模開放域?qū)υ捘P蚉LATO等,并推出智能對(duì)話定制和服務(wù)平臺(tái)UNIT,幫助開發(fā)者高效構(gòu)建智能對(duì)話系統(tǒng),實(shí)現(xiàn)規(guī)?;瘧?yīng)用。百度翻譯支持200多種語言,每天響應(yīng)超過千億字符的翻譯請(qǐng)求,支持超過40多萬家第三方應(yīng)用,技術(shù)上,提出了多智能體聯(lián)合學(xué)習(xí)、基于語義單元的同傳模型、稀缺語種分組混合訓(xùn)練算法等。
百度大腦語言與知識(shí)技術(shù)的持續(xù)探索和創(chuàng)新取得了令業(yè)界矚目的成績,同時(shí)這些技術(shù)以平臺(tái)化的方式輸出,賦能千行萬業(yè),持續(xù)提升產(chǎn)業(yè)智能化水平。
重磅推出5款產(chǎn)品的新發(fā)布、2大計(jì)劃
王海峰首次發(fā)布了百度大腦語言與知識(shí)產(chǎn)品全景圖。百度集團(tuán)副總裁吳甜接續(xù)發(fā)布語義理解技術(shù)與平臺(tái)文心、智能文檔分析平臺(tái)TextMind和AI同傳會(huì)議解決方案3大新產(chǎn)品,同時(shí)發(fā)布了6項(xiàng)升級(jí),包括智能創(chuàng)作平臺(tái)的3個(gè)場(chǎng)景方案、以及智能對(duì)話定制與服務(wù)平臺(tái)UNIT的3項(xiàng)全新升級(jí)。
圖:百度集團(tuán)副總裁吳甜
吳甜表示,“我們一直致力于將語言與知識(shí)技術(shù)凝聚成一系列技術(shù)平臺(tái)和產(chǎn)品,在應(yīng)用中產(chǎn)生大量價(jià)值,為廣大開發(fā)者和產(chǎn)業(yè)實(shí)踐者提供以語言與知識(shí)技術(shù)為核心驅(qū)動(dòng)的系列產(chǎn)品。”
百度推出的語義理解技術(shù)與平臺(tái)文心,基于深度學(xué)習(xí)平臺(tái)飛槳打造,依托領(lǐng)先的語義理解核心技術(shù),集成優(yōu)秀的預(yù)訓(xùn)練模型、全面的NLP算法集、端到端開發(fā)套件和平臺(tái),提供一站式NLP開發(fā)與服務(wù),讓開發(fā)者更簡(jiǎn)單、高效地定制企業(yè)級(jí)NLP模型。文心經(jīng)過了大量真實(shí)應(yīng)用場(chǎng)景的淬煉,具備優(yōu)秀的工業(yè)級(jí)落地實(shí)力。
全新發(fā)布的智能文檔分析平臺(tái)TextMind,基于OCR、NLP技術(shù),以文檔解析為核心能力,支持文檔對(duì)比與文檔審核,具備“多快好省”的核心優(yōu)勢(shì),促進(jìn)企業(yè)辦公智能升級(jí)。
百度大腦智能創(chuàng)作平臺(tái)針對(duì)媒體應(yīng)用場(chǎng)景再升級(jí),全新推出智能策劃、智能采編、智能審校三大媒體場(chǎng)景方案,進(jìn)一步助力媒體人更快、更好地創(chuàng)作,可謂切中媒體人的“痛點(diǎn)”。
智能對(duì)話定制與服務(wù)平臺(tái)UNIT升級(jí)3大特性:更智能的任務(wù)式對(duì)話理解、極致便捷的表格問答和融合通用的新對(duì)話引擎。此次UNIT全新升級(jí)的三大能力,將進(jìn)一步降低任務(wù)式對(duì)話、智能問答的定制成本,并融合通用對(duì)話能力,提升交互體驗(yàn)。
全新發(fā)布的AI同傳會(huì)議解決方案,覆蓋會(huì)議全場(chǎng)景、全流程,旨在打造用戶隨身的“會(huì)議同傳專家”。吳甜現(xiàn)場(chǎng)展示了如何只用一臺(tái)電腦和一部手機(jī)快速搭建一套同傳服務(wù),只需點(diǎn)點(diǎn)鼠標(biāo)、打幾個(gè)字,就能快速獲得專業(yè)的同傳服務(wù)。
數(shù)據(jù)匱乏、算力不足歷來是語言與知識(shí)技術(shù)研發(fā)中面臨的瓶頸。為突破瓶頸,百度聯(lián)合中國計(jì)算機(jī)學(xué)會(huì)、中國中文信息學(xué)會(huì)發(fā)起中文自然語言處理數(shù)據(jù)共建計(jì)劃——千言,解決數(shù)據(jù)稀缺問題。千言一期由來自國內(nèi)11家高校和企業(yè)的數(shù)據(jù)資源研發(fā)者共同建設(shè),已涵蓋開放域?qū)υ挕㈤喿x理解等7大任務(wù),20余個(gè)中文開源數(shù)據(jù)集。
百度技術(shù)委員會(huì)主席吳華表示,“未來,我們希望有更多的數(shù)據(jù)集作者能夠參與共建千言,共同推動(dòng)中文信息處理技術(shù)的進(jìn)步,建設(shè)世界范圍的中文信息處理影響力。我們計(jì)劃在未來3年,面向20多個(gè)任務(wù),收集和建設(shè)不少于100個(gè)中文自然語言處理數(shù)據(jù)集,覆蓋語言與知識(shí)技術(shù)全部領(lǐng)域。”
圖:百度技術(shù)委員會(huì)主席吳華(中)與中國中文信息學(xué)會(huì)副理事長兼秘書長孫樂(左)、中國計(jì)算機(jī)學(xué)會(huì)自然語言處理專委會(huì)主任周國棟(右)一起正式啟動(dòng)千言計(jì)劃
吳華還發(fā)布了百度語言與知識(shí)技術(shù)算力共享計(jì)劃,通過百度AI STUDIO平臺(tái)提供算力支持,讓廣大開發(fā)者破除算力桎梏,專注于技術(shù)創(chuàng)新。
十年征程,百度語言與知識(shí)技術(shù)發(fā)展歷程中培養(yǎng)、吸引了大量全球頂尖人才。會(huì)上,百度推出以王海峰為代表的百度NLP“十年十人”,十年堅(jiān)守,不忘初心,秉持“技術(shù)信仰”,勇攀技術(shù)高峰,矢志不渝致力于讓機(jī)器更好地理解世界、更好地服務(wù)于人。
正如王海峰所言,“我們致力于更好地與學(xué)術(shù)界、產(chǎn)業(yè)界攜手,推動(dòng)語言與知識(shí)技術(shù)發(fā)展,進(jìn)而推動(dòng)人工智能技術(shù)持續(xù)進(jìn)步,為產(chǎn)業(yè)智能升級(jí)、社會(huì)經(jīng)濟(jì)高質(zhì)量發(fā)展貢獻(xiàn)力量。我們對(duì)未來充滿信心,堅(jiān)持研究和發(fā)展讓機(jī)器掌握知識(shí)、理解語言、擁有智能,繼續(xù)突破和創(chuàng)新,為技術(shù)和社會(huì)進(jìn)步做出更大貢獻(xiàn)。”
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。