2016年,隨著移動互聯(lián)網(wǎng)紅利的消退,人工智能正在成為硅谷乃至全球科技界新的角逐對象。未來,人工智能除了化身陪伴機器人、個性化私教、機器人醫(yī)生,還會為眾多創(chuàng)業(yè)者和開發(fā)者帶來哪些機遇?
放眼AI產(chǎn)業(yè)鏈,語音、圖像、人機交互等多項AI技術(shù)成熟度顯著提升;智能機器人領(lǐng)域大規(guī)模并購與融資不斷推動產(chǎn)業(yè)鏈走向成熟;人工智能正在加速滲透醫(yī)療、教育、金融、汽車等傳統(tǒng)垂直領(lǐng)域。
對于AI的時代意義,百度在2016年世界大會上給出了一個頗為震撼的定義:AI相當(dāng)于第四次工業(yè)革命,將帶來諸多產(chǎn)業(yè)的變革,這就如100 年前電能對世界的意義一樣。
為了賦能合作伙伴抓住AI的時代風(fēng)口、拉動產(chǎn)業(yè)全面升級,百度宣布對外開放兩大人工智能平臺——百度深度學(xué)習(xí)平臺(PaddlePaddle)和百度大腦開放平臺(ai.baidu.com)。
據(jù)悉,相比其他平臺,百度深度學(xué)習(xí)平臺(PaddlePaddle)具備易學(xué)易用、性能高效兩大特點,在序列數(shù)據(jù)準(zhǔn)備、序列模型訓(xùn)練、圖片分類模型上遠優(yōu)于第三方平臺。同時,該深度學(xué)習(xí)平臺支持多GPU集群、分布式訓(xùn)練、序列學(xué)習(xí)和稀疏訓(xùn)練。
此外,百度大腦開放平臺(ai.baidu.com)將全面開放AI前沿能力,向合作伙伴提供技術(shù)與培訓(xùn)資料。
目前,百度大腦集算法、計算、數(shù)據(jù)于一身,建成了一個超大規(guī)模的神經(jīng)網(wǎng)絡(luò),擁有萬億級參數(shù)。數(shù)據(jù)是人工智能火箭的燃料,百度大腦通過十多年積累的搜索數(shù)據(jù)、全網(wǎng)網(wǎng)頁數(shù)據(jù)、百億級圖像、視頻、定位數(shù)據(jù)擁有了得天獨厚的優(yōu)勢,并在語音、圖像、自然語音理解和用戶畫像上成果頗豐:語音識別率達到97%,被MIT評選為2016十大突破性技術(shù),成為唯一一家上榜的中國公司;語音合成日請求2.5億;人臉檢測準(zhǔn)確率達到99.7%;百度機器翻譯技術(shù)目前已實現(xiàn)支持27種語言;用戶畫像擁有千萬級的細分標(biāo)簽,10億全平臺累積用戶… …
在百度世界大會上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏表示,PC互聯(lián)網(wǎng)用20多年時間積累的用戶群體和市場空間,移動互聯(lián)網(wǎng)僅用了4年便已完成。人工智能作為下一幕的發(fā)展動力,整個社會都將迎來變革式發(fā)展。百度大腦將在開放的基礎(chǔ)上與不同行業(yè)發(fā)生碰撞,并衍生出不同領(lǐng)域的行業(yè)大腦,比如醫(yī)療大腦、交通大腦、金融大腦等,讓各個行業(yè)因智而能。
目前,百度大腦已經(jīng)運用到教育、金融和娛樂等多個行業(yè)。會上,眾多百度大腦的合作伙伴分享了與百度合作背后的收益。電影《魔獸》的制作方傳奇影業(yè)利用百度用戶畫像技術(shù)實現(xiàn)了精準(zhǔn)推薦、推升票房;在營銷領(lǐng)域,百度大腦孵化的AR技術(shù)已經(jīng)幫助歐萊雅完成了一次創(chuàng)新性的品牌營銷,未來具備豐富的應(yīng)用場景;處于商業(yè)化初期的百度開放云通過人工智能技術(shù)幫助入職不到一個月的銷售員變身為熟練、老道的業(yè)務(wù)能手,展現(xiàn)了百度大腦在銷售領(lǐng)域的想象空間。
未來,隨著百度人工智能技術(shù)在教育、醫(yī)療等場景深耕細作和進一步開放,百度將人工智能與傳統(tǒng)行業(yè)結(jié)合,不僅將實現(xiàn)傳統(tǒng)產(chǎn)業(yè)的升級換代,還將進入大眾生活中,為公眾帶來全新體驗。
據(jù)悉,截至2015年,全球人工智能初創(chuàng)企業(yè)已有855家,橫跨13個門類,總估值超過87億美元。毫無疑問,在時代變革的拐點,抓住人工智能就抓住了未來。百度作為最早布局人工智能領(lǐng)域的公司,全面開放幫助傳統(tǒng)企業(yè)和開發(fā)者升級,也是在經(jīng)濟新常態(tài)下促進整個社會經(jīng)濟發(fā)展的體現(xiàn)。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。