2016年,隨著移動互聯(lián)網(wǎng)紅利的消退,人工智能正在成為硅谷乃至全球科技界新的角逐對象。未來,人工智能除了化身陪伴機器人、個性化私教、機器人醫(yī)生,還會為眾多創(chuàng)業(yè)者和開發(fā)者帶來哪些機遇?
放眼AI產(chǎn)業(yè)鏈,語音、圖像、人機交互等多項AI技術(shù)成熟度顯著提升;智能機器人領(lǐng)域大規(guī)模并購與融資不斷推動產(chǎn)業(yè)鏈走向成熟;人工智能正在加速滲透醫(yī)療、教育、金融、汽車等傳統(tǒng)垂直領(lǐng)域。
對于AI的時代意義,百度在2016年世界大會上給出了一個頗為震撼的定義:AI相當于第四次工業(yè)革命,將帶來諸多產(chǎn)業(yè)的變革,這就如100 年前電能對世界的意義一樣。
為了賦能合作伙伴抓住AI的時代風口、拉動產(chǎn)業(yè)全面升級,百度宣布對外開放兩大人工智能平臺——百度深度學習平臺(PaddlePaddle)和百度大腦開放平臺(ai.baidu.com)。
據(jù)悉,相比其他平臺,百度深度學習平臺(PaddlePaddle)具備易學易用、性能高效兩大特點,在序列數(shù)據(jù)準備、序列模型訓練、圖片分類模型上遠優(yōu)于第三方平臺。同時,該深度學習平臺支持多GPU集群、分布式訓練、序列學習和稀疏訓練。
此外,百度大腦開放平臺(ai.baidu.com)將全面開放AI前沿能力,向合作伙伴提供技術(shù)與培訓資料。
目前,百度大腦集算法、計算、數(shù)據(jù)于一身,建成了一個超大規(guī)模的神經(jīng)網(wǎng)絡(luò),擁有萬億級參數(shù)。數(shù)據(jù)是人工智能火箭的燃料,百度大腦通過十多年積累的搜索數(shù)據(jù)、全網(wǎng)網(wǎng)頁數(shù)據(jù)、百億級圖像、視頻、定位數(shù)據(jù)擁有了得天獨厚的優(yōu)勢,并在語音、圖像、自然語音理解和用戶畫像上成果頗豐:語音識別率達到97%,被MIT評選為2016十大突破性技術(shù),成為唯一一家上榜的中國公司;語音合成日請求2.5億;人臉檢測準確率達到99.7%;百度機器翻譯技術(shù)目前已實現(xiàn)支持27種語言;用戶畫像擁有千萬級的細分標簽,10億全平臺累積用戶… …
在百度世界大會上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏表示,PC互聯(lián)網(wǎng)用20多年時間積累的用戶群體和市場空間,移動互聯(lián)網(wǎng)僅用了4年便已完成。人工智能作為下一幕的發(fā)展動力,整個社會都將迎來變革式發(fā)展。百度大腦將在開放的基礎(chǔ)上與不同行業(yè)發(fā)生碰撞,并衍生出不同領(lǐng)域的行業(yè)大腦,比如醫(yī)療大腦、交通大腦、金融大腦等,讓各個行業(yè)因智而能。
目前,百度大腦已經(jīng)運用到教育、金融和娛樂等多個行業(yè)。會上,眾多百度大腦的合作伙伴分享了與百度合作背后的收益。電影《魔獸》的制作方傳奇影業(yè)利用百度用戶畫像技術(shù)實現(xiàn)了精準推薦、推升票房;在營銷領(lǐng)域,百度大腦孵化的AR技術(shù)已經(jīng)幫助歐萊雅完成了一次創(chuàng)新性的品牌營銷,未來具備豐富的應(yīng)用場景;處于商業(yè)化初期的百度開放云通過人工智能技術(shù)幫助入職不到一個月的銷售員變身為熟練、老道的業(yè)務(wù)能手,展現(xiàn)了百度大腦在銷售領(lǐng)域的想象空間。
未來,隨著百度人工智能技術(shù)在教育、醫(yī)療等場景深耕細作和進一步開放,百度將人工智能與傳統(tǒng)行業(yè)結(jié)合,不僅將實現(xiàn)傳統(tǒng)產(chǎn)業(yè)的升級換代,還將進入大眾生活中,為公眾帶來全新體驗。
據(jù)悉,截至2015年,全球人工智能初創(chuàng)企業(yè)已有855家,橫跨13個門類,總估值超過87億美元。毫無疑問,在時代變革的拐點,抓住人工智能就抓住了未來。百度作為最早布局人工智能領(lǐng)域的公司,全面開放幫助傳統(tǒng)企業(yè)和開發(fā)者升級,也是在經(jīng)濟新常態(tài)下促進整個社會經(jīng)濟發(fā)展的體現(xiàn)。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠?qū)碗s指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學領(lǐng)域帶來了效率和精度的雙重突破。