ChatGPT為代表的AIGC應(yīng)用,正在以“迅雷不及掩耳”之勢(shì),帶來(lái)人工智能的新想象,雖然數(shù)據(jù)庫(kù)不處于人工智能的最前沿,但作為人工智能的基礎(chǔ)設(shè)施,都在不由的為這個(gè)快速成長(zhǎng)的“孩子”做好準(zhǔn)備,呵護(hù)AIGC應(yīng)用的大批來(lái)襲。
人工智能會(huì)因?yàn)镃hatGPT的火爆而有大量的應(yīng)用涌現(xiàn)出來(lái),數(shù)字化的進(jìn)程會(huì)因此提速,這些應(yīng)用的前提是,要有一個(gè)能為人工智能應(yīng)用普及化到來(lái)而準(zhǔn)備的數(shù)據(jù)庫(kù)。這樣的數(shù)據(jù)庫(kù)是否已經(jīng)有了?是否能在AIGC時(shí)代,不拖后腿,還能助一臂之力?
坐在記者面前的阿里云數(shù)據(jù)庫(kù)產(chǎn)品事業(yè)部負(fù)責(zé)人李飛飛,看起來(lái)胸有成竹。阿里云瑤池?cái)?shù)據(jù)庫(kù),將云原生數(shù)據(jù)庫(kù)PolarDB和云原生數(shù)據(jù)倉(cāng)庫(kù)AnalyticDB打通融合,形成了“云原生一體化”的HTAP解決方案。阿里云還推出了全新多模數(shù)據(jù)庫(kù)Lindorm AI 引擎,在數(shù)據(jù)庫(kù)內(nèi)集成人工智能能力,對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行智能分析和處理,打造AIGC應(yīng)用的數(shù)據(jù)基礎(chǔ)設(shè)施。
圖:阿里云數(shù)據(jù)庫(kù)產(chǎn)品事業(yè)部負(fù)責(zé)人李飛飛
人工智能來(lái)襲?已經(jīng)準(zhǔn)備好
AIGC時(shí)代需要能夠支持海量、多模態(tài)數(shù)據(jù)的數(shù)據(jù)庫(kù),因?yàn)锳IGC一定是需要多模態(tài)的數(shù)據(jù)、不是單一形態(tài)的數(shù)據(jù),所以阿里云Lindorm數(shù)據(jù)庫(kù)就非常好地滿足了這個(gè)條件。
“這些應(yīng)用的背后,可能會(huì)是基于用戶自建的數(shù)據(jù)模型,也可能會(huì)是第三方的模型,這種多模態(tài)共存的方式,接下來(lái)會(huì)成為普遍存在的現(xiàn)象。支撐海量、多模態(tài)數(shù)據(jù)的低成本、高效率的存儲(chǔ)和處理,這是Lindorm這么多年打造的堅(jiān)實(shí)基礎(chǔ)。但光有這個(gè)不行,還需要能夠支持豐富、靈活、強(qiáng)大的模型導(dǎo)入和使用。”
如此眾多的模型,對(duì)數(shù)據(jù)庫(kù)來(lái)說(shuō),就好比是“人民戰(zhàn)爭(zhēng)的汪洋大海”。
李飛飛指出,阿里云應(yīng)對(duì)的辦法是——足夠的開(kāi)放,用平臺(tái)化的方式去賦予數(shù)據(jù)庫(kù)更多的能力,去無(wú)縫導(dǎo)入第三方的模型。
把用戶導(dǎo)入的模型放在一個(gè)機(jī)密容器里,保證模型安全。導(dǎo)入模型以后,結(jié)合多模態(tài)數(shù)據(jù),這個(gè)想象空間天花板就非常高。有多模態(tài)數(shù)據(jù)高效低成本的存儲(chǔ),加上第三方靈活開(kāi)放應(yīng)用的導(dǎo)入,任何事情幾乎都可以干,足以應(yīng)對(duì)AIGC的各種創(chuàng)新需求。
當(dāng)然,隨著AIGC的相關(guān)應(yīng)用推進(jìn),人工智能逐漸的平民化,數(shù)據(jù)庫(kù)在運(yùn)維管控層面,運(yùn)維和調(diào)優(yōu)會(huì)也變得更加智能化。“過(guò)去,MySQL和PostgreSQL都是幾百個(gè)參數(shù)起,每個(gè)參數(shù)對(duì)不同場(chǎng)景的影響都不一樣,依賴有經(jīng)驗(yàn)的DBA和開(kāi)發(fā)者,就像老中醫(yī)開(kāi)藥方一樣,有的藥方靈,有的藥方吃了就沒(méi)有用,”李飛飛說(shuō),“這些都會(huì)隨之變得平民化和智能化,運(yùn)維、高可用的檢測(cè)告警、異常的報(bào)警,等等這些都會(huì)智能化。其實(shí)這件事已經(jīng)發(fā)展幾年了,但是接下來(lái)的一到兩年會(huì)加速。”
如果人工智能加速變革,那么數(shù)字化必然也會(huì)加快腳步。
李飛飛指出,“過(guò)去一二十年,是信息時(shí)代的數(shù)字化,也就是說(shuō),是企業(yè)的信息化辦公實(shí)現(xiàn)了數(shù)字化。比如我們實(shí)現(xiàn)了無(wú)紙化辦公,比如說(shuō)電話會(huì)議等等,這叫信息化的數(shù)字化。”
當(dāng)人工智能到了臨界點(diǎn),一定會(huì)催生兩個(gè)趨勢(shì):李飛飛說(shuō)“一個(gè)叫物理世界數(shù)字化,還有一個(gè)是生物世界數(shù)字化,不管是在中國(guó)、美國(guó)還是歐洲,人類對(duì)長(zhǎng)生不老的追求是生生不息的,所以生物世界數(shù)字化一定會(huì)是非常熱的熱點(diǎn)。還有物理世界數(shù)字化,將整個(gè)物理世界數(shù)字化。”
我們正在經(jīng)歷、見(jiàn)證著這樣的變革。
數(shù)據(jù)中心的“四化”
數(shù)字化的變革時(shí)代,AIGC帶來(lái)的智能化浪潮,智能化的趨勢(shì)無(wú)可厚非,除了智能化,李飛飛提到了數(shù)據(jù)庫(kù)發(fā)展到現(xiàn)在的發(fā)展階段,云計(jì)算進(jìn)入深水區(qū),就像我們要進(jìn)行“四個(gè)現(xiàn)代化建設(shè)”一樣,數(shù)據(jù)庫(kù)也要實(shí)現(xiàn)“四化”,除了要發(fā)展智能化,數(shù)據(jù)庫(kù)還要大力發(fā)展云原生化、平臺(tái)化、一體化。
站在今天這個(gè)節(jié)點(diǎn),已經(jīng)沒(méi)有人再質(zhì)疑數(shù)據(jù)庫(kù)向云原生化演進(jìn)的必要性和現(xiàn)實(shí)的緊迫感,已經(jīng)有非常成熟的存儲(chǔ)計(jì)算分離技術(shù),存儲(chǔ)池化、計(jì)算池化帶來(lái)高可用、高可靠彈性,現(xiàn)在進(jìn)入云原生化。
李飛飛說(shuō):“隨著數(shù)據(jù)量爆發(fā)式的增長(zhǎng),數(shù)據(jù)形態(tài)的多元化,以及業(yè)務(wù)的多樣化,數(shù)字化深入帶來(lái)業(yè)務(wù)多樣化是必然的,傳統(tǒng)的單一的數(shù)據(jù)庫(kù)產(chǎn)品包打天下、解決所有問(wèn)題的時(shí)代已經(jīng)結(jié)束了,一定是用一個(gè)平臺(tái)化的思維去構(gòu)建可能有多個(gè)引擎,基于平臺(tái)來(lái)提供一個(gè)一整套的、一站式的能力和解決方案,這就是數(shù)據(jù)庫(kù)的平臺(tái)化。”
以后的數(shù)據(jù)庫(kù),不用再去管是集中式數(shù)據(jù)庫(kù)、分布式數(shù)據(jù)庫(kù),這個(gè)問(wèn)題應(yīng)該由數(shù)據(jù)庫(kù)本身來(lái)解決,什么時(shí)候用集中式架構(gòu),什么時(shí)候用分布式架構(gòu),是有業(yè)務(wù)需要來(lái)抉擇的,自動(dòng)在兩者之間切換,平滑地轉(zhuǎn)化,實(shí)現(xiàn)云原生分布式真正的一體化,集中分布一體化。
阿里云瑤池?cái)?shù)據(jù)庫(kù)卡位“云原生+一站式”的數(shù)據(jù)管理與服務(wù),正在用這樣的理念,做更符合這個(gè)時(shí)代的數(shù)據(jù)庫(kù)產(chǎn)品。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。
琢磨技術(shù)發(fā)展史,關(guān)注算力產(chǎn)業(yè),關(guān)注數(shù)字經(jīng)濟(jì)。
參與編寫(xiě)了《開(kāi)源法則》(人民郵電出版社),《人類計(jì)算簡(jiǎn)史:從中國(guó)算盤(pán)到數(shù)字經(jīng)濟(jì)》(中共中央黨校出版社)。