CNET科技資訊網(wǎng) 1月20日 上海消息: 我們將邁入大數(shù)據(jù)的一個新時代,敏捷、準(zhǔn)確、低成本的數(shù)據(jù)分析和預(yù)測將成為現(xiàn)實。20日,阿里云發(fā)布大數(shù)據(jù)平臺數(shù)加,集合了計算引擎、開發(fā)套件、可視化工具和行業(yè)解決方案,這是全球首個囊括前、中、后臺的大數(shù)據(jù)一站式開發(fā)平臺,可讓數(shù)據(jù)分析和預(yù)測成本降至原有的10%左右。
這次阿里云發(fā)布的大數(shù)據(jù)開發(fā)平臺,囊括了阿里巴巴十余年來的大數(shù)據(jù)技術(shù),這些技術(shù)正在阿里系的各個商業(yè)場景中發(fā)揮作用,例如淘寶首頁給你推薦什么樣的商品、你的芝麻信用分是多少、誰可以獲得更大的花唄額度,或者誰可以直接獲得貸款。
“過去6年來,阿里巴巴巨大的戰(zhàn)略投資就是放在云計算和大數(shù)據(jù)服務(wù)上。我們相信人類已經(jīng)從IT時代在步入DT(Data Techonology)時代。”馬云在2015年致投資者公開信中表示,“我們必須在數(shù)據(jù)技術(shù)的投入和發(fā)展上不惜一切的投入發(fā)展,我們正在努力讓數(shù)據(jù)和計算能力成為普惠經(jīng)濟的基礎(chǔ)。”
馬云的DT技術(shù)正在變現(xiàn),集成了人工智能、機器學(xué)習(xí)、智能語音等前沿技術(shù)的阿里云大數(shù)據(jù)平臺數(shù)加,讓沒有足夠技術(shù)實力的公司,也能實現(xiàn)從數(shù)據(jù)中提煉“石油”。權(quán)威研究機構(gòu)IDC數(shù)據(jù)顯示,2014年中國企業(yè)投入了約14億美元購買商業(yè)分析軟件和服務(wù),這個數(shù)字在未來5年內(nèi)將呈幾何式增長。
“未來3年,大數(shù)據(jù)市場規(guī)模將達到1萬億元。”阿里云總裁胡曉明在發(fā)布會上表示,基于阿里云大數(shù)據(jù)平臺數(shù)加,將有千余家合作伙伴、萬名首席數(shù)據(jù)官和5萬數(shù)據(jù)科學(xué)家誕生,把中國大數(shù)據(jù)市場規(guī)模拓展至萬億規(guī)模。
“大數(shù)據(jù)”一詞近年來在中國十分火熱,但真正的數(shù)據(jù)技術(shù)和工具平臺一直缺位。“中國的數(shù)據(jù)技術(shù)起步比硅谷晚,但我們看到互聯(lián)網(wǎng)巨頭們正在大量投入研發(fā)力量,來縮短差距。”Alliance Development Group分析師David Sullivan表示,以阿里巴巴為典型的中國互聯(lián)網(wǎng)公司正在自己的商業(yè)場景中大規(guī)模使用數(shù)據(jù)技術(shù),技術(shù)上與硅谷幾乎沒有差距。
在發(fā)布會上,阿里云提及去年年底剛剛刷新的一項世界紀(jì)錄。在由數(shù)據(jù)庫之父Jim Gray創(chuàng)辦的排序基準(zhǔn)評估競賽Sort Benchmark中,阿里云把100TB數(shù)據(jù)的排序時間縮短到了377秒,打破了此前由雅虎、微軟、斯坦福大學(xué)等公司與機構(gòu)保持的紀(jì)錄。
從成本上來說,阿里云的大數(shù)據(jù)平臺也把數(shù)據(jù)技術(shù)的使用成本拉到一個新的時代。“數(shù)據(jù)分析和預(yù)測的成本將降至原有的10%,數(shù)據(jù)技術(shù)將變成普惠的技術(shù)能力,企業(yè)可以跨過技術(shù)和資金的障礙,真正從數(shù)據(jù)中掘金。”阿里云大數(shù)據(jù)事業(yè)部資深總監(jiān)徐常亮表示。
驟降的數(shù)據(jù)成本可能讓IBM一類的公司倍感壓力,因為這讓他們提供的傳統(tǒng)BI軟件顯得價格昂貴。此前,企業(yè)的數(shù)據(jù)挖掘依賴購買BI類軟件,這類軟件不但購買和維護費用高昂,還不能實現(xiàn)在線實時數(shù)據(jù)分析。
“實時數(shù)據(jù)分析和預(yù)測才是數(shù)據(jù)技術(shù)的魅力所在。”徐常亮表示,阿里云大數(shù)據(jù)平臺數(shù)加將為各類機構(gòu)和企業(yè)帶來全新的決策依據(jù),“企業(yè)們將實時知曉自己面對的挑戰(zhàn),并基于數(shù)據(jù)預(yù)測來判斷下一步該往哪走。”
在不久前,阿里云公布了一項與浙江省交通廳的合作,浙江省交通廳利用阿里云的大數(shù)據(jù)平臺來預(yù)測高速公路未來5到60分鐘的車速情況,預(yù)測準(zhǔn)確率穩(wěn)定在91%以上?;诟咚佘囁兕A(yù)測,以便交通部門更好的進行交通引導(dǎo),公眾也可以做出更優(yōu)的路線選擇。
“一開始大家關(guān)心的問題是數(shù)據(jù)運算的速度有多快,然后關(guān)心預(yù)測的速度有多快。”徐常亮表示,“現(xiàn)在,大家該關(guān)心的問題是我是否比競爭對手更快得到數(shù)據(jù)結(jié)果,是否比競爭對手擁有更準(zhǔn)確的預(yù)測。我們就是想為大家提供這樣更快、更準(zhǔn)確的大數(shù)據(jù)平臺。”
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。