5月20日,阿里巴巴副總裁、阿里云計算平臺負(fù)責(zé)人賈揚(yáng)清在媒體溝通會上表示,數(shù)字經(jīng)濟(jì)迅猛發(fā)展,不斷豐富、增長的數(shù)智業(yè)務(wù),對技術(shù)提出了更高的挑戰(zhàn),企業(yè)的數(shù)字化創(chuàng)新需要用好“大數(shù)據(jù)+AI”這個“核武器”。
經(jīng)過近20年的發(fā)展,大數(shù)據(jù)已從早期的數(shù)據(jù)挖掘進(jìn)化為承載數(shù)據(jù)分析、數(shù)據(jù)管理、數(shù)據(jù)協(xié)同的綜合治理平臺。阿里巴巴在數(shù)據(jù)治理方面擁有豐富的經(jīng)驗(yàn),無論是簡單、易用、彈性的云數(shù)據(jù)倉庫MaxCompute,還是提供一站式數(shù)據(jù)開發(fā)、管理、治理的平臺DataWorks,都能成為企業(yè)數(shù)字化的“好幫手”。
建筑行業(yè)領(lǐng)頭羊——中建三局一公司,就基于阿里云的DataWorks和MaxCompute構(gòu)建了數(shù)智建造一站式服務(wù)平臺。該平臺覆蓋了建造領(lǐng)域生產(chǎn)場景全鏈路、核心管控全流程和智能決策全視角,使建造類企業(yè)實(shí)時感知、動態(tài)控制和智能化決策成為現(xiàn)實(shí)。
中建三局只是建筑行業(yè)的一個縮影。事實(shí)上,大數(shù)據(jù)技術(shù)早已經(jīng)廣泛應(yīng)用到各行各業(yè)的數(shù)字化轉(zhuǎn)型中。
中建三局?jǐn)?shù)智建造一站式服務(wù)平臺
金融行業(yè),天弘基金每天有百億級數(shù)據(jù)量實(shí)時在線交易,采用阿里云飛天大數(shù)據(jù)平臺,使數(shù)據(jù)清算時長從8小時縮至1.5小時;在線教育行業(yè),VIPKID在阿里云大數(shù)據(jù)技術(shù)的輔助下,實(shí)現(xiàn)了60%的問題自動化處理,投訴率降低66%;快狗打車基于阿里云,實(shí)現(xiàn)了經(jīng)緯度數(shù)據(jù)實(shí)時決策,15秒及時響應(yīng),3分鐘車到位,貨車空駛率降低30%……
對企業(yè)來說,業(yè)務(wù)要創(chuàng)新提高效率,僅僅把數(shù)據(jù)管的好、用的好,還不夠,還需要AI技術(shù)的加持。“大數(shù)據(jù)和AI密不可分,結(jié)合在一起,更能幫助企業(yè)在數(shù)字時代從容應(yīng)對不確定性。”賈揚(yáng)清表示。
隨著數(shù)據(jù)量越來越大,模型變得越來越精準(zhǔn)、高效且復(fù)雜。因此,無論是在數(shù)據(jù)還是計算方面,都需要有一個更加大規(guī)模、大體量的底座,來支撐上層AI的需求。
為此,阿里云機(jī)器學(xué)習(xí)平臺PAI構(gòu)建了靈活、易用和功能豐富的機(jī)器學(xué)習(xí)全棧產(chǎn)品:PAI-Studio(可視化建模平臺)、PAI-DSW(云原生交互式建模平臺)、PAI-DLC(云原生AI基礎(chǔ)平臺)、PAI-EAS(云原生彈性推理服務(wù)平臺)。
對企業(yè)來說,工程化已經(jīng)超越算法,成為AI落地的更大瓶頸。日前,阿里巴巴與清華大學(xué)合作發(fā)布了超大規(guī)模中文多模態(tài)預(yù)訓(xùn)練千億參數(shù)模型M6。該模型的數(shù)據(jù)集包含超過1.9 TB圖像和292GB文本,參數(shù)規(guī)模達(dá)到1000億,可完成產(chǎn)品描述生成、視覺問答、問答、中國詩歌生成等跨模態(tài)任務(wù)。
目前,M6已經(jīng)用于業(yè)務(wù)場景里。在犀牛新制造的服裝設(shè)計上,M6可以根據(jù)潮流趨勢文本的描述,自動產(chǎn)出細(xì)節(jié)清晰的服裝圖,并符合生產(chǎn)標(biāo)準(zhǔn)。
我們希望將M6的場景化服務(wù)能力開放給所有企業(yè)。”賈揚(yáng)清表示。
要把AI轉(zhuǎn)化為生產(chǎn)力,不僅要懂 AI、還更要懂行業(yè)。阿里云機(jī)器學(xué)習(xí)平臺PAI以電商、金融、游戲、直播等業(yè)務(wù)為起點(diǎn),在智能推薦、用戶增長、金融風(fēng)控、音視頻文本等多模態(tài)場景積累了豐富的實(shí)戰(zhàn)經(jīng)驗(yàn),沉淀了大量成熟算法、框架及工程化組件等“原子能力”,幫助開發(fā)者及企業(yè)客戶更快地孵化和構(gòu)建新場景業(yè)務(wù)。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗(yàn)證有效性。