CNET科技資訊網(wǎng) 5月12日 北京消息:由IDC研究、希捷科技贊助的《數(shù)據(jù)時代2025》白皮書昨天在北京發(fā)布。白皮書預(yù)測,到2025年,全球的數(shù)據(jù)量將達(dá)到163ZB,是目前的10倍;同時,數(shù)據(jù)的來源以及由數(shù)據(jù)飆升引起的應(yīng)用趨勢也會產(chǎn)生變化,這是數(shù)據(jù)未來的大勢所趨。
IDC高級副總裁David Reinsel現(xiàn)場表示:“數(shù)據(jù)發(fā)展趨勢一直是IDC關(guān)注的焦點,它和我們的生活息息相關(guān),并將在未來的世界中發(fā)揮更為關(guān)鍵的作用。不管是對政府、企業(yè)還是個人來講,數(shù)據(jù)的影響已經(jīng)遠(yuǎn)遠(yuǎn)超越我們的預(yù)期,就像幾十年前我們沒有想象無人駕駛汽車以及智能機器人在我們的生活中出現(xiàn)并且?guī)眍嵏残宰兏镆粯?,相信不斷變化的?shù)據(jù)還將繼續(xù)滲透到我們生活中,以更多、更新的方式,影響人類的生活。”
正如David Reinsel所說,過去十年間,我們經(jīng)歷了從模擬到數(shù)字的轉(zhuǎn)型,數(shù)據(jù)飆升的背景下,將帶來數(shù)據(jù)處理能力的挑戰(zhàn),而抓住數(shù)據(jù)的來源,是數(shù)據(jù)分析和利用的一步,根據(jù)IDC報告預(yù)測,未來163ZB的數(shù)據(jù)主要來自于三個方面:
1、企業(yè)數(shù)據(jù)中心或者企業(yè)云數(shù)據(jù)產(chǎn)生的大量核心數(shù)據(jù):至2025年核心數(shù)據(jù)的高于10倍的平均增速,很大一部分原因是由于大量的數(shù)據(jù)被存儲于私有云、公有云以及混合云中,實現(xiàn)了從終端數(shù)據(jù)向企業(yè)云數(shù)據(jù)的轉(zhuǎn)化。
2、邊緣數(shù)據(jù):邊緣數(shù)據(jù)是相對于核心數(shù)據(jù)而言的,是指核心數(shù)據(jù)以外的企業(yè)級計算機或設(shè)備,其中包括服務(wù)器機房、小型數(shù)據(jù)中心等。
3、終端數(shù)據(jù):是指網(wǎng)絡(luò)邊緣的所有設(shè)備,包括 PC、手機、攝像機、智能汽車、可穿戴設(shè)備,2012年前終端數(shù)據(jù)增長快速,得益于智能手機以及PC所產(chǎn)生的大量數(shù)據(jù),而2012年后,終端數(shù)據(jù)的增長速度有所減緩,低于10倍平均增速,主要數(shù)據(jù)來自于安防攝像機等嵌入式設(shè)備。
“數(shù)據(jù)對于企業(yè)的重要性不言而喻,在大數(shù)據(jù)時代,企業(yè)如果在數(shù)據(jù)挖掘、分析和管理上更勝一籌,就有機會在大數(shù)據(jù)潮流中把握商機。”希捷科技全球副總裁暨亞太和中國區(qū)總裁孫丹表示,企業(yè)領(lǐng)導(dǎo)者在面對海量數(shù)據(jù)的時候,需要按照數(shù)據(jù)的重要程度進行分析,最終分析提取關(guān)鍵數(shù)據(jù),給用戶體驗帶來有意義的影響,并且,重視識別和維護這部分關(guān)鍵數(shù)據(jù),以發(fā)揮潛在價值。實際上與大浪淘沙的道理是一樣的。
希捷科技全球副總裁暨亞太和中國區(qū)總裁孫丹
具體而言,數(shù)據(jù)的挖掘能力惠及企業(yè)、消費者和各行各業(yè)。對于企業(yè)來講,海量的數(shù)據(jù)中蘊藏著無盡的商機,能夠?qū)Υ髷?shù)據(jù)進行有效獲取、合理分析和妥善利用,會為企業(yè)的發(fā)展帶來無限空間,也是數(shù)據(jù)時代企業(yè)精準(zhǔn)抓住商機的最有效途徑。從消費者的角度來說,無人駕駛汽車以及數(shù)字化設(shè)備為生活帶來前所未有的便捷和精彩,視頻會議、網(wǎng)上購物和人工智能給消費者帶來了工作和生活方式的大轉(zhuǎn)變。曾經(jīng)推動了企業(yè)成功運營的數(shù)據(jù),現(xiàn)如今成為了消費者、政府和企業(yè)日常各方面順利運作的關(guān)鍵要素。從電網(wǎng)和供水系統(tǒng)到醫(yī)院、公共交通和道路網(wǎng)絡(luò),實時數(shù)據(jù)的增長數(shù)量、速度和重要性上都顯得極為引人注目。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。