CNET科技資訊網(wǎng) 5月25日 北京消息(文/齊豐潤): 隨著信息技術(shù)的發(fā)展,如今,信息爆炸已成為常態(tài),對于所有企業(yè)來說,數(shù)據(jù)的管理和維護(hù)都已經(jīng)成為了一項十分重要且關(guān)系到企業(yè)健康發(fā)展的工作。近日,Veritas發(fā)布了《數(shù)據(jù)冰山報告》,根據(jù)報告顯示,當(dāng)前全球企業(yè)存儲的數(shù)據(jù)中,52%的數(shù)據(jù)為價值尚不明確的暗數(shù)據(jù),33%的數(shù)據(jù)屬于對企業(yè)沒有價值的冗余、過期或不重要的陳舊數(shù)據(jù)。每年,企業(yè)都會在數(shù)據(jù)管理上投入大量的財力和精力,而這85%的數(shù)據(jù)對這些投入都造成了極大的浪費。
同時,報告還指出對于那些擁有1,000TB數(shù)據(jù)的普通中型企業(yè)來講,企業(yè)每年存儲非關(guān)鍵業(yè)務(wù)數(shù)據(jù)的成本將超過400萬元人民幣。
據(jù)悉,Veritas發(fā)布的全球《數(shù)據(jù)冰山報告》基于對22個國家、地區(qū)中的2500多名IT專業(yè)人士進(jìn)行調(diào)研而成。在此之前,Veritas就在之前發(fā)布的《數(shù)據(jù)基因指數(shù)》報告中指出,40%以上的企業(yè)存儲數(shù)據(jù)在三年內(nèi)未曾修改,屬于“過期”數(shù)據(jù)。本次發(fā)布的《數(shù)據(jù)冰山報告》也證實,企業(yè)IT領(lǐng)導(dǎo)層已經(jīng)認(rèn)識到數(shù)據(jù)囤積的問題。這兩份業(yè)內(nèi)領(lǐng)先的調(diào)研報告從員工角度和文件系統(tǒng)現(xiàn)狀出發(fā),希望能夠同時幫助企業(yè)應(yīng)對當(dāng)前嚴(yán)峻的數(shù)據(jù)增長態(tài)勢,促使他們采取行動。
報告中提及,全球約52%的企業(yè)存儲數(shù)據(jù)為暗數(shù)據(jù)(Dark Data)或陳舊數(shù)據(jù) (ROT Data)。中國位居世界第10名,暗數(shù)據(jù)比例為54.5%,比全球平均水平高2.5%。在純凈數(shù)據(jù)和已標(biāo)記為關(guān)鍵業(yè)務(wù)數(shù)據(jù)方面,與15%的全球平均水平相比,排名前三的國家分別為中國 (25%)、以色列 (24%) 以及巴西 (22%)。由此可以看出,超過75%的中國企業(yè)數(shù)據(jù)為暗數(shù)據(jù)或?qū)I(yè)務(wù)而言毫無價值的陳舊數(shù)據(jù)。
細(xì)分原因,造成大量暗數(shù)據(jù)與陳舊數(shù)據(jù)出現(xiàn)的原因除了數(shù)據(jù)的量級越來越大之外,數(shù)據(jù)囤積文化以及員工對待數(shù)據(jù)冷漠的態(tài)度也成為了十分重要的原因。
在全球企業(yè)中,平均有26.5%的員工會在工作設(shè)備中存儲個人數(shù)據(jù)。從員工遵從企業(yè)數(shù)據(jù)策略方面看,中國排名居中,員工在工作設(shè)備上存儲個人數(shù)據(jù)的比例為26%。由于企業(yè)中存儲的大部分?jǐn)?shù)據(jù)是暗數(shù)據(jù),IT人員無法分辨出哪些數(shù)據(jù)擁有業(yè)務(wù)價值。
在中國,員工將企業(yè)網(wǎng)絡(luò)用于個人的情況越發(fā)普遍,這導(dǎo)致企業(yè)存儲資源中,個人法律和ID文檔比率占68%、照片文件占64%,而未經(jīng)批準(zhǔn)的軟件則占32%。雖然這些內(nèi)容看上去無關(guān)緊要,但部分文件也許會觸犯數(shù)據(jù)隱私或造成潛在版權(quán)隱患。
Veritas公司大中華區(qū)總裁蕭建生表示:“企業(yè)解決‘數(shù)據(jù)冰山’現(xiàn)狀的首要舉措是去認(rèn)識并了解所存在的數(shù)據(jù)囤積文化。當(dāng)下,中國企業(yè)迫切需要掌控他們的‘數(shù)據(jù)冰山’,并發(fā)現(xiàn)數(shù)據(jù)中的業(yè)務(wù)價值和風(fēng)險。企業(yè)應(yīng)該根據(jù)數(shù)據(jù)保留策略對數(shù)據(jù)進(jìn)行分類,目前,中國僅有19%的企業(yè)采用基于數(shù)據(jù)保留策略進(jìn)行數(shù)據(jù)分類這樣的舉措。我們可以看到,企業(yè)對實施有效的暗數(shù)據(jù)信息治理的需求呈現(xiàn)出上升的態(tài)勢。”
隨著云服務(wù)產(chǎn)品的興起,許多企業(yè)都選擇將自己的數(shù)據(jù)向云上遷移,而這也加劇了“數(shù)據(jù)冰山”現(xiàn)象的產(chǎn)生。2016年,云服務(wù)和云技術(shù)的利用率將從33%增長至46%,Veritas預(yù)計到2016年底,中國將有約47%的數(shù)據(jù)遷移至云。Veritas認(rèn)為,數(shù)據(jù)的云遷移只是將問題越推越遠(yuǎn),為企業(yè)增加更多未經(jīng)分類的暗數(shù)據(jù)。
而針對這些潛在的威脅,企業(yè)們應(yīng)當(dāng)如何做好對策和防范也成為了一個相當(dāng)重要的課題。首先是觀念上的改變,并不是越多的數(shù)據(jù)就會帶來越多的價值,通過技術(shù)手段發(fā)現(xiàn)并整理暗數(shù)據(jù)以及陳舊數(shù)據(jù)才會為企業(yè)保持健康,創(chuàng)造更多價值。
除此之外,制定最適合企業(yè)自身的數(shù)據(jù)規(guī)范,有公司高層制定可行的信息策略,也是消除數(shù)據(jù)冰山現(xiàn)象的可行之路。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。