作為任何企業(yè)進行新的應(yīng)用部署或系統(tǒng)更新的重要組成部分,數(shù)據(jù)遷移可以完成的遠不止簡單的數(shù)據(jù)傳輸。我們完全可以把它當作改進現(xiàn)有數(shù)據(jù)質(zhì)量的一個機會,而且還可以對信息應(yīng)用采用更高標準,為公司增添力量。它也可作為數(shù)據(jù)治理計劃的理想試點。
數(shù)據(jù)治理是一個不斷發(fā)展的學(xué)科。其目的是通過持續(xù)應(yīng)用標準流程及方法,給予公司對數(shù)據(jù)質(zhì)量和安全性的控制。
數(shù)據(jù)治理著眼于:提高數(shù)據(jù)質(zhì)量、保護敏感數(shù)據(jù)、鼓勵信息共享、提供關(guān)鍵業(yè)務(wù)數(shù)據(jù)、信息生命周期中的管理。
“許多數(shù)據(jù)遷移項目存在這樣的問題:過于頻繁地把遺留環(huán)境中的壞數(shù)據(jù)移動到全新系統(tǒng)中。”Informatica產(chǎn)品戰(zhàn)略副總裁RobKarel說。“在您把數(shù)據(jù)遷移到新的應(yīng)用系統(tǒng)之前,您必須先要詢問哪些數(shù)據(jù)可以放入新的干凈環(huán)境中。”
Karel主張將應(yīng)用數(shù)據(jù)清理規(guī)則、統(tǒng)協(xié)重復(fù)數(shù)據(jù)以及清除孤立和未使用數(shù)據(jù)作為邁向數(shù)據(jù)治理標準的良好開端。
“因為對數(shù)據(jù)治理項目的支持或許可望而不可及,通常需要一套有用的具體步驟來開始。”Karel建議要像TDWI研究概括的那樣,使用以下八個步驟,啟動一個包含數(shù)據(jù)遷移的數(shù)據(jù)治理方案:
學(xué)習數(shù)據(jù)質(zhì)量技術(shù)并加以應(yīng)用。數(shù)據(jù)質(zhì)量是一整套技術(shù)和實踐,它能為企業(yè)數(shù)據(jù)遷移工作的成功做出巨大貢獻。
及早并經(jīng)常剖析數(shù)據(jù)質(zhì)量。剖析數(shù)據(jù)質(zhì)量奠定了企業(yè)為新系統(tǒng)制定數(shù)據(jù)質(zhì)量、模型、架構(gòu)及使用規(guī)則標準的基礎(chǔ)。
在前進過程中創(chuàng)建業(yè)務(wù)詞匯表。根據(jù)業(yè)務(wù)使用情況定義遺留或新系統(tǒng)中的數(shù)據(jù)。
使用數(shù)據(jù)質(zhì)量度量標準。使用這些度量標準持續(xù)改進數(shù)據(jù),并治理數(shù)據(jù)遷移前后的整個生命周期。
糾正不合規(guī)數(shù)據(jù)。使用有利工具,以允許運行時自動及手動數(shù)據(jù)遷移數(shù)據(jù)的一致性問題。
通過驗證和確認治理實時數(shù)據(jù)。一旦新系統(tǒng)啟動并運行,在持續(xù)基礎(chǔ)上監(jiān)測關(guān)鍵信息,以確保數(shù)據(jù)與數(shù)據(jù)治理政策及標準相容。
使用管理技術(shù)以調(diào)整數(shù)據(jù)治理和業(yè)務(wù)目標。數(shù)據(jù)管理非常重要,因為這一角色為業(yè)務(wù)和技術(shù)團隊的溝通服務(wù)。
協(xié)作管理。跨職能團隊決定遷移過程中哪些數(shù)據(jù)應(yīng)該被治理以及如何治理,所有數(shù)據(jù)并非同等重要。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。