億次。”
阿里巴巴高級(jí)技術(shù)專家 羅金鵬
4月20日, UBDC全域大數(shù)據(jù)峰會(huì)·2016上,阿里巴巴公共數(shù)據(jù)平臺(tái)負(fù)責(zé)人羅金鵬首次對(duì)外披露了在阿里中臺(tái)戰(zhàn)略下,如何推動(dòng)數(shù)據(jù)中臺(tái)落地的個(gè)中細(xì)節(jié)。
據(jù)悉,中臺(tái)戰(zhàn)略是阿里巴巴于2015年底首次提出。作為阿里中臺(tái)戰(zhàn)略的核心之一——數(shù)據(jù)中臺(tái)旨在對(duì)內(nèi)提供數(shù)據(jù)基礎(chǔ)建設(shè)和統(tǒng)一的數(shù)據(jù)服務(wù),對(duì)外提供服務(wù)商家的數(shù)據(jù)產(chǎn)品。
OneData是阿里數(shù)據(jù)中臺(tái)的核心,羅金鵬介紹,OneData體系建立的集團(tuán)數(shù)據(jù)公共層,從設(shè)計(jì)、開發(fā)、部署和使用上保障了數(shù)據(jù)口徑的規(guī)范和統(tǒng)一,實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)全鏈路管理,提供標(biāo)準(zhǔn)數(shù)據(jù)輸出。
統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)是一項(xiàng)非常復(fù)雜的工作,譬如,針對(duì)UV這一相同的指標(biāo),在統(tǒng)一之前阿里內(nèi)部竟然有10多種數(shù)據(jù)定義。據(jù)介紹,OneData數(shù)據(jù)公共層總共對(duì)30000多個(gè)數(shù)據(jù)指標(biāo)進(jìn)行了口徑的規(guī)范和統(tǒng)一,梳理后縮減為3000余個(gè)。
盡管工程浩大,但是此舉卻為阿里帶來(lái)了顯著的收效。借助于OneData平臺(tái)實(shí)時(shí)數(shù)據(jù)分析能力,在2015年雙11當(dāng)天,淘寶搜索排序中引入實(shí)時(shí)數(shù)據(jù)影響因子,實(shí)現(xiàn)增收數(shù)十億元,羅金鵬表示。
在DT時(shí)代,數(shù)據(jù)暴增對(duì)存儲(chǔ)計(jì)算成本帶來(lái)很大的挑戰(zhàn)。據(jù)羅金鵬介紹在沒(méi)有建設(shè)統(tǒng)一的數(shù)據(jù)公共層時(shí),阿里內(nèi)部服務(wù)器需求量會(huì)在5年之后達(dá)到現(xiàn)在的100倍之多。而經(jīng)過(guò)數(shù)據(jù)公共層的統(tǒng)一建設(shè),5年后的服務(wù)器需求量相對(duì)會(huì)節(jié)約90%。
此外,阿里基于數(shù)據(jù)中臺(tái)孵化了一個(gè)內(nèi)部名叫“GProfile”全域用戶檔案的標(biāo)簽服務(wù)。“GProfile”根據(jù)用戶行為,打上不同的標(biāo)簽,再推薦與買家消費(fèi)能力和喜好匹配的商品?;诖嗣總€(gè)用戶在手機(jī)淘寶上搜索“連衣裙”,每個(gè)人看到的搜索結(jié)果都是不一樣。
千人千面的個(gè)性化服務(wù)背后的數(shù)據(jù)基礎(chǔ)就是“GProfile”。據(jù)羅金鵬的介紹,目前標(biāo)簽有300多種,如此多的標(biāo)簽,都是為了更精準(zhǔn)地定位用戶,從而實(shí)現(xiàn)更好的用戶體驗(yàn)與精準(zhǔn)營(yíng)銷。
除對(duì)內(nèi)挖掘數(shù)據(jù)的價(jià)值,用技術(shù)驅(qū)動(dòng)和創(chuàng)新內(nèi)部的業(yè)務(wù),阿里數(shù)據(jù)同時(shí)也將數(shù)據(jù)能力通過(guò)產(chǎn)品對(duì)外服務(wù)。而這一產(chǎn)品即是“生意參謀”,為商家提供多維度的數(shù)據(jù)服務(wù),幫助商家通過(guò)數(shù)據(jù)分析來(lái)進(jìn)行商業(yè)決策。
羅金鵬告訴記者,生意參謀可以用數(shù)據(jù)化來(lái)貫穿到企業(yè)管理的整體鏈路中,包括了,品類管理數(shù)據(jù)化、營(yíng)銷數(shù)據(jù)化、品牌數(shù)據(jù)化以及服務(wù)數(shù)據(jù)化。
據(jù)悉到目前為止,生意參謀已經(jīng)為千萬(wàn)商家服務(wù),月成交額30萬(wàn)元以上的商家中,逾90%在使用生意參謀;月成交金額100萬(wàn)元以上的商家中,逾90%每月登錄生意參謀天次達(dá)20次以上。
在DT時(shí)代,數(shù)據(jù)已經(jīng)成為推動(dòng)商業(yè)發(fā)展的新能源,而數(shù)據(jù)中臺(tái)的建設(shè)成為新能源能否在阿里巴巴生態(tài)中發(fā)揮價(jià)值的關(guān)鍵。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。