一年一度的百度世界大會召開在即,每年百度都會在會上宣布重要技術(shù)突破或者戰(zhàn)略級產(chǎn)品,從中也能窺得未來數(shù)年百度的技術(shù)動向。這些信息,往往從歷年的邀請函、以及百度近期的新聞中也可以窺得一二。
2015年,百度世界大會的主題是“索引真實(shí)世界,連接3600行”,善于觀察的人在當(dāng)年的邀請函上便早早發(fā)現(xiàn)了玄機(jī)。
用驗(yàn)鈔筆掃描邀請函的封面后,“清明上河圖”的底紋上印著“虹橋若波”的字樣,寓意互聯(lián)網(wǎng)讓各行各業(yè)的連接更加緊密,正暗示了百度欲借O2O連接人與服務(wù)。
今年的邀請函更為炫酷,主題也更加明確。邀請函的主體為城市地標(biāo)模型,用導(dǎo)電筆涂抹電路板虛線后,整個城市模型就會被點(diǎn)亮。邀請函的頂端寫著本次大會的slogan:“AI is the new electricity(人工智能是新電能)”。可以看出,人工智能將成為本次大會的亮點(diǎn)。而百度近期在人工智能方面的一舉一動,都為這次猜想提供了線索。
在今年6月的百度聯(lián)盟峰會上,百度董事長兼首席執(zhí)行官李彥宏提出,互聯(lián)網(wǎng)發(fā)展的下一幕將圍繞人工智能展開。在7月份的財報電話會上,李彥宏繼續(xù)強(qiáng)調(diào)了對人工智能的重視,稱人工智能正在成為萬物命脈。這些信息都透露出人工智能在百度中的關(guān)鍵地位。
不僅僅是百度,谷歌、微軟、蘋果、阿里巴巴、騰訊等國內(nèi)外巨頭都紛紛在人工智能領(lǐng)域發(fā)力,人工智能的大趨勢無須質(zhì)疑。在各大公司前仆后繼搶占人工智能風(fēng)口之際,此時布局的思路和戰(zhàn)略就成了決定成敗的關(guān)鍵。百度這次將人工智能定義為“新電能”透露出許多信號,是否暗示著人工智能將成為公司的核心驅(qū)動?百度是否計(jì)劃360度全面賦能人工智能?
官網(wǎng)中顯示的嘉賓名單,除了百度董事長兼首席執(zhí)行官李彥宏、百度首席科學(xué)家吳恩達(dá),還有英偉達(dá)公司的聯(lián)合創(chuàng)始人兼CEO黃仁勛。
英偉達(dá)是深度學(xué)習(xí)的倡導(dǎo)者和最強(qiáng)大的并行計(jì)算供應(yīng)商, 在GPU領(lǐng)域擁有絕對的話語權(quán)。
當(dāng)下,GPU正在成為訓(xùn)練深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)最熱門的方法,谷歌、微軟、IBM、阿里巴巴、騰訊等公司紛紛嘗試用此方案解決大量復(fù)雜的分析性、數(shù)據(jù)豐富的問題。而百度是最早一批利用GPU開展人工智能研究的企業(yè)。
英偉達(dá)與百度的合作也頗有淵源。2005年,兩家公司便開始了在數(shù)據(jù)解析領(lǐng)域的合作。另外,吳恩達(dá)還在斯坦福大學(xué)任教時,便與黃仁勛惺惺相惜。吳恩達(dá)曾帶領(lǐng)人工智能團(tuán)隊(duì)發(fā)現(xiàn) GPU 能夠幾百倍地加速深度學(xué)習(xí)系統(tǒng),訓(xùn)練一個四層神經(jīng)網(wǎng)絡(luò)由之前幾周時間變成了不到一天。黃仁勛得知后稱這是一個令人高興的對稱:GPU 這一游戲工作者用于為游戲玩家構(gòu)建幻想世界的芯片也能用于幫助計(jì)算機(jī)通過深度學(xué)習(xí)理解真實(shí)世界。
在經(jīng)過了這么多年的醞釀與磨合,此次黃仁勛的出席,是否暗示著百度與英偉達(dá)將有更為深入的戰(zhàn)略合作?
百度于2015年年底成立了無人車事業(yè)部,正式將無人車設(shè)立為公司戰(zhàn)略方向之一,并宣布了無人車三年商用、五年量產(chǎn)的發(fā)展計(jì)劃。今年以來,百度無人車更是動作頻頻,先后與蕪湖、上海、烏鎮(zhèn)等地實(shí)現(xiàn)合作,上路指日可待。
此前有外媒對百度無人車與谷歌無人車進(jìn)行了對比,認(rèn)為谷歌雖較早布局無人車,但仍停留在自己的原型汽車中測試無人駕駛技術(shù),而百度則更具野心,已經(jīng)積極在美國和中國完成路側(cè),因?yàn)檩^谷歌更勝一籌。無人車無疑已經(jīng)成為百度人工智能的一大明星產(chǎn)品。
近日,百度無人車近日還載著兩只狗在某駕校進(jìn)行了駕校測試。讓人遐想的是,如果通過了駕??荚嚕敲窗俣葻o人車離我們還有多遠(yuǎn)?百度會不會在百度世界大會上宣布無人車的最新進(jìn)展?想想都讓人期待!
在上一屆百度世界大會上,百度推出機(jī)器人助理“度秘”,李彥宏還在現(xiàn)場演示了如何通過度秘購買電影票、在餐館訂座、用Uber叫車,展現(xiàn)了度秘強(qiáng)大的語音與服務(wù)功能。
今年四月,度秘機(jī)器人在肯德基現(xiàn)身,通過語音交互功能幫助顧客完成點(diǎn)餐,成為連鎖餐飲行業(yè)首個人工智能服務(wù)場景,實(shí)現(xiàn)了百度人工智能技術(shù)進(jìn)入人們線下日常生活服務(wù)場景的首次嘗試。
在經(jīng)過了一年的成長之后,新的度秘不免讓人期待。在百度人工智能的版圖中,度秘又會扮演什么樣的重要角色,這也是讓人頗為憧憬。
好文章,需要你的鼓勵
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運(yùn)動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運(yùn)動質(zhì)量,在多項(xiàng)測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。