在剛剛舉行的2016年百度世界上,除了李彥宏的主題演講,還有一位讓很多人感到意外的嘉賓現(xiàn)身,為這場(chǎng)技術(shù)大秀添加了一份驚喜。百度錢包代言人、著名演員胡歌與李彥宏同臺(tái)為現(xiàn)場(chǎng)觀眾展示了一段“百度大腦”核心能力——用戶畫像能力。
“你的粉絲都是一些什么樣的人,我們覺得你一定也很關(guān)心。”李彥宏告訴胡歌,通過大量的用戶行為數(shù)據(jù),百度大腦能夠描繪出他的粉絲群體的基本特點(diǎn),“我其實(shí)還是有一點(diǎn)驚訝,本來以為(喜歡)影視音樂(的人)應(yīng)該是最大的群體,但是我們看到像旅游出行、網(wǎng)絡(luò)購(gòu)物這些都是你粉絲群體特別特別喜歡的東西。”李彥宏表示,基于數(shù)億用戶各種各樣的標(biāo)簽獲得的群體畫像,還是比較可信的。
關(guān)于這項(xiàng)能力的基礎(chǔ),李彥宏介紹,“用戶畫像是基于百度大數(shù)據(jù)、機(jī)器學(xué)習(xí)獲得的能力。現(xiàn)在我們已經(jīng)有接近十億的用戶畫像,對(duì)于他們的識(shí)別,我們已經(jīng)細(xì)分到1000萬級(jí)細(xì)分標(biāo)簽,這些標(biāo)簽在兩個(gè)維度上體現(xiàn),一個(gè)是通用維度,也有一些垂直行業(yè)的特征。”李彥宏提出,用戶畫像能力對(duì)于了解用戶喜好、提升用戶粘性非常重要,因?yàn)?ldquo;我知道你是一個(gè)什么人,喜歡看什么樣的東西”。李彥宏告訴大家,在過去兩個(gè)月中,手機(jī)百度資訊的推薦用戶量有10倍的增長(zhǎng),這種增長(zhǎng)背后正是以用戶興趣、喜好為依據(jù)進(jìn)行的個(gè)性化新聞推薦,“它可以做到千人千面,其實(shí)準(zhǔn)確的講不是千人千面,而是萬人萬面,億人億面,每一個(gè)人對(duì)于百度來說都是不同的個(gè)體,每一個(gè)人看到的信息都是不一樣的。”他說。
除了為胡歌定制了粉絲群體畫像之外,李彥宏還分享了百度與電影《魔獸》制作方合作,利用用戶畫像提升電影票房的案例。“這個(gè)做法很聰明,他把人群分成三類,一類人是不管怎樣都要看的,另外一類是不管怎樣都不會(huì)看的。這兩類他都不太關(guān)心,關(guān)心的是他可以影響的人群,通過用戶畫像把這些人群從搖擺變成去看電影。”李彥宏告訴大家,用戶畫像能力為《魔獸》帶來了200%的票房提升,讓制作方驚喜不已。
對(duì)于用戶畫像能力的應(yīng)用空間,李彥宏表示,這還需要各行各業(yè)共同思考、探索,“我個(gè)人的想象力很有限,整個(gè)百度幾萬人想象力也是有限的,但是這些能力如果賦予很多很多人、幾億人、幾十億人,這個(gè)可能性幾乎是無限的。”
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對(duì)弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。