av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

<u id="xklvq"></u>

<abbr id="xklvq"><tr id="xklvq"></tr></abbr>

微信掃一掃，關(guān)注公眾號(hào)

科技行者
算力行者

見證連接與計(jì)算的「力量」

百度大腦3.0升級(jí) 詳解“多模態(tài)深度語義理解”

百度大腦3.0升級(jí) 詳解“多模態(tài)深度語義理解”

作者：科技行者

2018-07-04 22:45

分享至：

百度AI開發(fā)者大會(huì)（Baidu Create 2018）上，百度高級(jí)副總裁、AI技術(shù)平臺(tái)體系（AIG）總負(fù)責(zé)人王海峰發(fā)布百度大腦3.0，并指出，百度大腦3.0的核心是“多模態(tài)深度語義理解”，包括數(shù)據(jù)的語義，知識(shí)的語義，以及圖像、視頻、聲音、語音等各方面的理解。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2018-07-04 22:45 ? 科技行者

科技行者 7月4日北京消息： 7月4日召開的百度AI開發(fā)者大會(huì)（Baidu Create 2018）上，百度高級(jí)副總裁、AI技術(shù)平臺(tái)體系（AIG）總負(fù)責(zé)人王海峰發(fā)布百度大腦3.0，并指出，百度大腦3.0的核心是“多模態(tài)深度語義理解”，包括數(shù)據(jù)的語義，知識(shí)的語義，以及圖像、視頻、聲音、語音等各方面的理解。

多模態(tài)深度語義理解如何在技術(shù)上實(shí)現(xiàn)？擁有多大的能量？它將如何被應(yīng)用來改變我們的生活？當(dāng)天下午的百度大腦論壇中，百度大腦3.0的核心技術(shù)一一“亮相”，為開發(fā)者們帶來一場技術(shù)盛宴。

可容納1000人的會(huì)場座無虛席，開發(fā)者們甚至席地而坐，或者站在會(huì)場最后聽完整場分享。一位開發(fā)者表示，“干貨太多、時(shí)間太少，回去要找回放視頻好好消化一下。”

從“看清聽清”到“看懂聽懂”

“多模態(tài)深度語義理解能讓機(jī)器聽清、看清，更能深入理解它背后的含義，深度地理解真實(shí)世界，進(jìn)而更好地支撐各種應(yīng)用。”王海峰表示。

視覺語義化可以讓機(jī)器從看清到看懂視頻，并提煉出結(jié)構(gòu)化語義知識(shí)。百度視覺技術(shù)部、人臉技術(shù)部、增強(qiáng)現(xiàn)實(shí)技術(shù)部總監(jiān)吳中勤介紹，視覺語義化技術(shù)首先識(shí)別人、物體和場景，同時(shí)捕捉它們之間的行為和關(guān)系，通過時(shí)序化、數(shù)字化、結(jié)構(gòu)化的方式形成語義知識(shí)，最終結(jié)合領(lǐng)域和場景進(jìn)行智慧推理，落地行業(yè)應(yīng)用。比如在零售領(lǐng)域，它可以準(zhǔn)確判斷每個(gè)人的動(dòng)作、行為，真正實(shí)現(xiàn)顧客拿起商品就走。未來，視覺語義化技術(shù)還可進(jìn)一步延展，它結(jié)合新型的傳感器和AI芯片，可以在感知層面和計(jì)算層面得到大幅提升；結(jié)合手機(jī)可以帶給用戶更佳地使用體驗(yàn)。未來，百度視覺語義化技術(shù)將在百度AI開放平臺(tái)中開放給開發(fā)者使用。

語音技術(shù)的升級(jí)則讓機(jī)器更好地聽懂世界。百度語音技術(shù)部總監(jiān)高亮表示，百度基于遠(yuǎn)場的語音語義一體化技術(shù)取得重大突破，為業(yè)界提供更頂尖的遠(yuǎn)場語音技術(shù)。語音語義一體化將遠(yuǎn)場交互中高頻Query識(shí)別準(zhǔn)確率提升10個(gè)點(diǎn)，并保持普通Query識(shí)別率不降；多語種混合聲學(xué)建模基于Deep Peak2大幅提升中英文混合Query識(shí)別準(zhǔn)確率，相對錯(cuò)誤率比業(yè)界最好競品降低20%；新升級(jí)的TTS技術(shù)業(yè)界首創(chuàng)傳統(tǒng)拼接技術(shù)與Wavenet技術(shù)融合方案，保證合成質(zhì)量的同時(shí)大大降低成本，讓大規(guī)模應(yīng)用落地成為現(xiàn)實(shí)。此外，百度重磅發(fā)布遠(yuǎn)場語音技術(shù)低成本解決方案“度小云”，它基于Deep Peak V2語音識(shí)別技術(shù)、語音語義一體化技術(shù)及LSTM-VAD深度學(xué)習(xí)語音切分技術(shù)，實(shí)現(xiàn)業(yè)界領(lǐng)先的五級(jí)喚醒技術(shù)，并擁有基于Wavenet的精致音庫，支持遠(yuǎn)場優(yōu)化的音頻通信技術(shù)。未來開發(fā)者可以平等便捷地一站式獲取百度遠(yuǎn)場語音能力。

想要讓機(jī)器像人一樣擁有智能，將語言變成知識(shí)必不可缺。百度AI技術(shù)平臺(tái)體系執(zhí)行總監(jiān)吳甜表示，百度自然語言處理技術(shù)經(jīng)過多年的發(fā)展，已形成全面、前沿的格局。百度知識(shí)圖譜已發(fā)展為復(fù)雜、多元、全面的多元語義知識(shí)圖譜，包含實(shí)體圖譜、行業(yè)圖譜、事件圖譜、關(guān)注點(diǎn)圖譜、多媒體圖譜，其中實(shí)體圖譜已經(jīng)能夠覆蓋通用需求中90%的實(shí)體及其屬性。在閱讀理解技術(shù)上，百度大腦已經(jīng)閱讀了千億量級(jí)的文章，相當(dāng)于6萬個(gè)中國國家圖書館的藏書，并由此積累了億級(jí)實(shí)體、千億事實(shí)的知識(shí)，并通過“學(xué)習(xí)”真實(shí)應(yīng)用每天產(chǎn)生的知識(shí)不斷優(yōu)化。在對話理解方面，百度理解與交互技術(shù)平臺(tái)UNIT升級(jí)至2.0，進(jìn)一步增強(qiáng)冷啟動(dòng)能力，支持像人類一樣在對話當(dāng)中學(xué)習(xí)，同時(shí)開放了第一個(gè)工業(yè)級(jí)對話系統(tǒng)開源框架，降低搭建門檻，讓開發(fā)者無縫對接云端。百度將持續(xù)開源新的技術(shù)，提供更靈活便捷的方案，推動(dòng)自然語言理解技術(shù)的創(chuàng)新與發(fā)展。

夯實(shí)基礎(chǔ)：數(shù)據(jù)、算法、算力并駕齊驅(qū)

數(shù)據(jù)、算法、算力是影響人工智能技術(shù)發(fā)展的重要因素。主論壇中，王海峰表示百度大腦3.0首次將芯片納入技術(shù)體系，帶動(dòng)百度大腦算力爆發(fā)式增長。百度自主研發(fā)的中國第一款云端全功能AI芯片“昆侖”也在會(huì)上首次亮相。未來，AI芯片將與百度自主研發(fā)的PaddlePaddle深度學(xué)習(xí)框架相結(jié)合，推動(dòng)AI行業(yè)生態(tài)快速發(fā)展。

百度在2016年正式開源的PaddlePaddle，是最適合中國開發(fā)者的深度學(xué)習(xí)框架。主論壇中，王海峰發(fā)布PaddlePaddle3.0，下午，百度AI技術(shù)生態(tài)部總經(jīng)理喻友平對此進(jìn)行了詳細(xì)解讀。PaddlePaddle3.0包括完整的核心框架，以及AI Studio、AutoDL、EasyDL等可以讓開發(fā)者平等便捷獲取頂尖AI能力的平臺(tái)。PaddlePaddle3.0核心框架對服務(wù)器版本以及移動(dòng)端版本進(jìn)行了全面優(yōu)化，PaddlePaddle Fluid提供豐富的滿足常見主流模型搭建需求的API，支持廣泛的模型搭建，訓(xùn)練Runtime可以滿足各類型的模型訓(xùn)練需求；PaddlePaddle Serving可靈活適配多種預(yù)測引擎；PaddlePaddle Mobile集成百度移動(dòng)端預(yù)測的實(shí)踐經(jīng)驗(yàn)，提供多平臺(tái)支持。

PaddlePaddle3.0中，AutoDL備受關(guān)注。百度大數(shù)據(jù)（北京）實(shí)驗(yàn)室主任浣軍介紹，AutoDL能更高效自動(dòng)搜索神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，開發(fā)者無需特殊硬件設(shè)備可以快速得到高質(zhì)量模型。AutoDL提供多種能力，支持設(shè)計(jì)全新深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)，以及優(yōu)化現(xiàn)有深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)，同時(shí)能夠適配特定任務(wù)場景。

海量數(shù)據(jù)爆發(fā)式增長，發(fā)掘數(shù)據(jù)價(jià)值成為眾多行業(yè)的普遍需求。百度大數(shù)據(jù)部總監(jiān)郭謝表示，百度已形成從數(shù)據(jù)到數(shù)據(jù)工程、數(shù)據(jù)科學(xué)、數(shù)據(jù)產(chǎn)品再到行業(yè)方案的大數(shù)據(jù)產(chǎn)品技術(shù)棧，基于大數(shù)據(jù)特性，從生產(chǎn)資料和生產(chǎn)工具兩方面促進(jìn)產(chǎn)業(yè)發(fā)展。為了最大程度保證數(shù)據(jù)安全，百度正式發(fā)布大數(shù)據(jù)眾智開放平臺(tái)“點(diǎn)石”，基于全球領(lǐng)先的百度AI技術(shù)，全方位保障數(shù)據(jù)安全，并逐步開放工具能力，為行業(yè)數(shù)據(jù)安全賦能。

現(xiàn)場，百度啟動(dòng)了多項(xiàng)大賽。百度之星開發(fā)者大賽將如期回歸，此外還有基于PaddlePaddle的中國高校計(jì)算機(jī)大賽人工智能創(chuàng)意賽、KG-知識(shí)抽取賽、交通預(yù)測賽、無人車系列大賽，以及商家招牌的分類與檢測、人工智能加速器應(yīng)用與設(shè)計(jì)等大數(shù)據(jù)比賽。百度方面表示，歡迎各路高手挑戰(zhàn)，通過大賽攜手推動(dòng)整個(gè)AI產(chǎn)業(yè)的發(fā)展。

業(yè)內(nèi)人士評(píng)價(jià)，百度在推動(dòng)技術(shù)落地的同時(shí)不斷反哺技術(shù)升級(jí)，如今已成為國內(nèi)人工智能領(lǐng)域的領(lǐng)航者。百度大腦升級(jí)至3.0，也標(biāo)志著百度AI技術(shù)的一次跨越式升級(jí)，正如王海峰在開場中所強(qiáng)調(diào)，“百度AI能力的核心是百度大腦，百度大腦3.0是百度AI能力的集大成者。”?；诎俣却竽X持續(xù)突破的技術(shù)實(shí)力，百度有能力把頂尖的AI技術(shù)提供給中國開發(fā)者、企業(yè)，更讓每個(gè)開發(fā)者和企業(yè)都能平等獲取頂尖AI能力，繼而讓AI在中國遍地開花。

分享至

0贊

好文章，需要你的鼓勵(lì)

推薦文章

音頻生成
大語言模型
多模態(tài)AI

2025-09-10 09:47

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實(shí)驗(yàn)室團(tuán)隊(duì)AudioStory突破性進(jìn)展

騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng)，首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù)，通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練，能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異，為AI音頻創(chuàng)作開辟新方向。
視頻生成
深度學(xué)習(xí)
多模態(tài)學(xué)習(xí)

2025-09-09 13:57

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動(dòng)起來不再是奢望

Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù)，通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息，顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量，在多項(xiàng)測試中超越包括Sora在內(nèi)的商業(yè)模型，為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
多模態(tài)AI
人類價(jià)值觀對齊
數(shù)據(jù)集構(gòu)建

2025-09-09 13:56

上海AI實(shí)驗(yàn)室重磅發(fā)布：讓AI看圖"說人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價(jià)值觀對齊難題

上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究，首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測基準(zhǔn)，通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法，讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平，為AI價(jià)值觀對齊提供了可行技術(shù)路徑。
人工智能
圖神經(jīng)網(wǎng)絡(luò)
天氣預(yù)報(bào)

2025-09-09 10:56

谷歌研究團(tuán)隊(duì)發(fā)布超級(jí)預(yù)測模型：讓AI像天氣預(yù)報(bào)員一樣預(yù)測全球大氣變化

谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測模型，能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào)，準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù)，通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律，在極端天氣預(yù)測方面表現(xiàn)卓越，能耗僅為傳統(tǒng)方法的千分之一，為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實(shí)驗(yàn)室團(tuán)隊(duì)AudioStory突破性進(jìn)展

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實(shí)驗(yàn)室團(tuán)隊(duì)AudioStory突破性進(jìn)展

2025-09-10 09:47

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動(dòng)起來不再是奢望

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動(dòng)起來不再是奢望

2025-09-09 13:57

上海AI實(shí)驗(yàn)室重磅發(fā)布：讓AI看圖"說人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價(jià)值觀對齊難題

上海AI實(shí)驗(yàn)室重磅發(fā)布：讓AI看圖"說人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價(jià)值觀對齊難題

2025-09-09 13:56

谷歌研究團(tuán)隊(duì)發(fā)布超級(jí)預(yù)測模型：讓AI像天氣預(yù)報(bào)員一樣預(yù)測全球大氣變化

谷歌研究團(tuán)隊(duì)發(fā)布超級(jí)預(yù)測模型：讓AI像天氣預(yù)報(bào)員一樣預(yù)測全球大氣變化

2025-09-09 10:56

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網(wǎng)
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網(wǎng)
51CTO傳媒
投資界
科技訊
智者新時(shí)代

京ICP證15039648號(hào) 京ICP備15039648號(hào)-9 京公網(wǎng)安備 11010802021500號(hào)

北京第二十六維信息技術(shù)有限公司（至頂網(wǎng)）版權(quán)所有。 | 聯(lián)絡(luò)我們

舉報(bào)電話：010-62641205　涉未成年人舉報(bào)專線：010-62641208 舉報(bào)郵箱: jubao@zhiding.cn 　網(wǎng)上有害信息舉報(bào)專區(qū)：https://www.12377.cn

<em id="vbwvo"><span id="vbwvo"></span></em>