如何構(gòu)建數(shù)據(jù)服務(wù)平臺(tái)?如何讓數(shù)據(jù)服務(wù)平臺(tái)更好地為企業(yè)業(yè)務(wù)服務(wù)?【友盟+】基礎(chǔ)數(shù)據(jù)部技術(shù)總監(jiān)張金在2016中國(guó)數(shù)據(jù)庫(kù)技術(shù)大會(huì)(DTCC)上,分享了【友盟+】的經(jīng)驗(yàn),他表示,整合數(shù)據(jù)是建立數(shù)據(jù)服務(wù)平臺(tái)的首要任務(wù);統(tǒng)一數(shù)據(jù)、統(tǒng)一服務(wù)、統(tǒng)一接口是建立數(shù)據(jù)服務(wù)平臺(tái)的三大目標(biāo)。
(圖為:【友盟+】基礎(chǔ)數(shù)據(jù)部技術(shù)總監(jiān) 張金)
整合數(shù)據(jù)是關(guān)鍵
數(shù)據(jù)打通是長(zhǎng)期困擾大數(shù)據(jù)領(lǐng)域的一道難題,由于數(shù)據(jù)的多源化、碎片化,以及數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)庫(kù)技術(shù)的差別,導(dǎo)致數(shù)據(jù)很難融通,大數(shù)據(jù)的價(jià)值并沒(méi)有充分挖掘出來(lái),同時(shí)也為構(gòu)建大數(shù)據(jù)平臺(tái)帶來(lái)了很多挑戰(zhàn)。張金表示,“在面對(duì)迅猛發(fā)展的數(shù)據(jù)業(yè)務(wù)時(shí),整合數(shù)據(jù)是建立數(shù)據(jù)服務(wù)平臺(tái)的首要任務(wù),這樣才能提升數(shù)據(jù)存儲(chǔ)效率和安全性,提升數(shù)據(jù)的使用效率和價(jià)值。以【友盟+】數(shù)據(jù)服務(wù)平臺(tái)為例,圍繞客戶關(guān)心的服務(wù)構(gòu)建整個(gè)數(shù)據(jù)服務(wù)平臺(tái)中的數(shù)據(jù)、算法和開(kāi)放三個(gè)子平臺(tái)。數(shù)據(jù)平臺(tái)是要解決“有什么”的問(wèn)題,解決數(shù)據(jù)的整合、清洗、打通、盤(pán)點(diǎn)。算法平臺(tái),解決“怎么用”的問(wèn)題,提供統(tǒng)一基礎(chǔ)設(shè)施解決方案。開(kāi)放平臺(tái),解決“方便性”的問(wèn)題,完備配套設(shè)施:安全、賬號(hào)、權(quán)限、計(jì)費(fèi)。統(tǒng)一數(shù)據(jù),統(tǒng)一服務(wù),統(tǒng)一接口是建立數(shù)據(jù)服務(wù)平臺(tái)的三大目標(biāo)。“
接下來(lái),張金進(jìn)一步給出了直指三個(gè)目標(biāo)的解決方案。
首先是統(tǒng)一數(shù)據(jù),至少要解決五方面的問(wèn)題:1、數(shù)據(jù)遷移整合,建立數(shù)據(jù)流轉(zhuǎn)通路2、制定數(shù)據(jù)規(guī)范,統(tǒng)一研發(fā)標(biāo)準(zhǔn),統(tǒng)一命名規(guī)則3、用戶ID打通,ID Mapping系統(tǒng)4、統(tǒng)一指標(biāo)和標(biāo)簽體系,確立標(biāo)準(zhǔn),消除二義性5、建立日常數(shù)據(jù)透視,隨時(shí)了解數(shù)據(jù)狀況。
以ID Mapping為例
【友盟+】數(shù)據(jù)服務(wù)平臺(tái)使用海量種類豐富的ID配對(duì)數(shù)據(jù),通過(guò)算法對(duì)所有ID進(jìn)行關(guān)聯(lián)映射,將同一個(gè)體的多個(gè)用戶ID聚合在一起,最終實(shí)現(xiàn)Cookie、IMEI、IDFA、第三方賬號(hào)等不同場(chǎng)景下的用戶ID全打通,從而能夠全面分析全域范圍下的用戶行為。
以標(biāo)簽體系為例
【友盟+】數(shù)據(jù)服務(wù)平臺(tái)根據(jù)分類梳理標(biāo)簽,即構(gòu)造完整的標(biāo)簽體系,挖掘分析出“人口屬性”、“長(zhǎng)期愛(ài)好”、“短期興趣”和“關(guān)鍵詞標(biāo)簽”等人群標(biāo)簽,以滿足各種數(shù)據(jù)應(yīng)用場(chǎng)景中的對(duì)精準(zhǔn)定向的需求。例如,一個(gè)跑步愛(ài)好者適合企業(yè)進(jìn)行長(zhǎng)期品牌影響,而一個(gè)馬上想買(mǎi)鞋的人可能就需要快速而精準(zhǔn)直接的商品推薦。
其次是統(tǒng)一接口,傳統(tǒng)的方法是為每一個(gè)功能包裝一個(gè)接口,這種方法存在的問(wèn)題是,混亂的接口設(shè)計(jì),錯(cuò)綜復(fù)雜的調(diào)用關(guān)系,苦、不靈活、重復(fù)勞動(dòng),【友盟+】摸索出的新方法讓業(yè)務(wù)開(kāi)發(fā)工程師只需要關(guān)心2件事情:1、統(tǒng)一的調(diào)用方式;2、清晰的邏輯數(shù)據(jù)表。
最后是統(tǒng)一服務(wù),提供統(tǒng)一基礎(chǔ)設(shè)施的解決方案。
以U-DMP為例
【友盟+】數(shù)據(jù)管理平臺(tái)(U-DMP),基于大數(shù)據(jù)分析的客戶洞察,讓企業(yè)能夠輕松洞察并定向目標(biāo)人群,從而更好地幫助企業(yè)進(jìn)行商業(yè)營(yíng)銷。張金舉例說(shuō):【友盟+】曾經(jīng)遇到一個(gè)經(jīng)典的案例,某著名電腦品牌對(duì)某款產(chǎn)品受眾定位是高端的白領(lǐng)女性,但經(jīng)過(guò)對(duì)購(gòu)買(mǎi)人群的畫(huà)像透視后,結(jié)果發(fā)現(xiàn)購(gòu)買(mǎi)者大相徑庭:大部分的受眾為男性青年中等收入者。而 U-DMP這時(shí)就發(fā)揮了重要的作用,一是可以幫助企業(yè)洞悉自己的目標(biāo)人群(如會(huì)員、曾經(jīng)的購(gòu)買(mǎi)者)。通過(guò)分析目標(biāo)人群的畫(huà)像,了解目標(biāo)人群的特質(zhì)(如地域分布、與其他品類的重疊受眾)。從而在U-DMP上圈選出所需的特定人群,進(jìn)行推薦、EDM、甚至聯(lián)合營(yíng)銷等相關(guān)的營(yíng)銷手段。配合人群放大功能,進(jìn)一步擴(kuò)大營(yíng)銷受眾和影響力。這項(xiàng)服務(wù)讓企業(yè)能夠輕松洞察并定向目標(biāo)人群,從而最好地滿足這些需求來(lái)提升客戶體驗(yàn)。“
【友盟+】:全球領(lǐng)先的第三方全域大數(shù)據(jù)服務(wù)提供商,依托于自主研發(fā)的全域數(shù)據(jù)平臺(tái),為客戶提供一站式數(shù)據(jù)化解決方案。一方面提供數(shù)據(jù)產(chǎn)品,包括APP開(kāi)發(fā)工具、基礎(chǔ)統(tǒng)計(jì)工具、廣告效果監(jiān)測(cè)工具等,另一方面提供數(shù)據(jù)交換及專業(yè)的數(shù)據(jù)分析和咨詢服務(wù),包括DMP、垂直領(lǐng)域數(shù)據(jù)化解決方案、數(shù)據(jù)運(yùn)營(yíng)分析報(bào)告等。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。