作者 | 金旺
來源 | 科技行者
2004年,谷歌啟動了一項影響深遠的“登月計劃”——數(shù)字圖書館計劃。
作為谷歌第一個“登月計劃”,這一計劃旨在將當(dāng)時全世界1.2億冊圖書掃描成PDF格式,將人類沉淀下來的寶貴知識搬到互聯(lián)網(wǎng)上,以期知識共享。
隨后,谷歌先后與哈佛大學(xué)、斯坦福大學(xué)、牛津大學(xué)、密歇根大學(xué)等高校圖書館及城市公共圖書館簽訂合作協(xié)議,來完成谷歌的宏圖大愿。
到2015年,《紐約時報》報道谷歌這項計劃時,谷歌已經(jīng)完成了超過2500萬冊圖書的數(shù)字化。
倘若每本書以2MB來計算的話,這堪稱人類歷史上最早的數(shù)字化工程,十年間產(chǎn)生的數(shù)據(jù)量約為0.047PB。
這一年,全球數(shù)據(jù)量達到了8.6ZB,云計算、人工智能等技術(shù)正在讓大數(shù)據(jù)發(fā)揮魔力,中國數(shù)字經(jīng)濟達到了18.6萬億元,GDP占比27.5%。
這時,作為數(shù)字經(jīng)濟三大IT基礎(chǔ)設(shè)施之一,中國數(shù)據(jù)庫產(chǎn)業(yè)首先在金融行業(yè)迎來了變革。
01 金融轉(zhuǎn)向分布式
作為數(shù)據(jù)密集型產(chǎn)業(yè),金融領(lǐng)域是最早采用數(shù)據(jù)庫的產(chǎn)業(yè)之一,也是最早對數(shù)據(jù)庫架構(gòu)提出新需求的產(chǎn)業(yè)。
四川農(nóng)商聯(lián)合銀行就是在2018年做出決定,要對包括數(shù)據(jù)庫在內(nèi)的IT基礎(chǔ)設(shè)施進行技術(shù)轉(zhuǎn)型。
四川農(nóng)商聯(lián)合銀行,股份改制之前又稱作“四川農(nóng)信”,作為常年服務(wù)于四川各市縣6000萬用戶的地方銀行,四川農(nóng)商聯(lián)合銀行擁有近5000個營業(yè)點,超4萬員工,核心用戶有著小額高頻取現(xiàn)需求的特點,日交易量高達3300萬筆、交易額約1000億元,春節(jié)高峰期的幾天日交易量甚至?xí)槐吨唷?/p>
這是四川農(nóng)商聯(lián)合銀行業(yè)務(wù)上的特性,在技術(shù)上,四川農(nóng)商聯(lián)合銀行在2018年之前,有多達6種數(shù)據(jù)庫,每種數(shù)據(jù)庫都需要購買原廠服務(wù),再加上設(shè)備成本、維護成本、人工成本,每年都是一筆不小的開支。
尤其四川地處地震多發(fā)地帶,近十年發(fā)生的5級地震就有30多次,這樣的地震對人類生活不會造成太大的影響,但對于金融行業(yè)中的大型機卻存在威脅。
在地震時,一個微小的接頭松動,就有可能導(dǎo)致幾千萬的交易量掉線,因而四川農(nóng)商聯(lián)合銀行當(dāng)時每年維護成本一大半都花在了大型機維護上。
再加上數(shù)據(jù)庫降本增效的需求,四川農(nóng)商聯(lián)合銀行的數(shù)據(jù)庫技術(shù)轉(zhuǎn)型在2018年開始提上日程。
這一年,數(shù)據(jù)庫領(lǐng)域也有了新的架構(gòu)變化。
回顧過去幾十年數(shù)據(jù)庫發(fā)展歷程,數(shù)據(jù)庫基礎(chǔ)架構(gòu)大致分為集中式和分布式兩個階段。
在早期信息化階段,基于集中式架構(gòu)的數(shù)據(jù)庫一直是全球金融、電信、交通行業(yè)信息化轉(zhuǎn)型的最優(yōu)解,然而隨著互聯(lián)網(wǎng)的興起,線上業(yè)務(wù)量越來越大,高昂的運維成本和煙囪式部署的歷史遺留問題就成了企業(yè)數(shù)字化轉(zhuǎn)型的瓶頸,基于分布式架構(gòu)數(shù)據(jù)庫的出現(xiàn)就成了歷史的必然。
作為一款100%自研的原生分布式數(shù)據(jù)庫,OceanBase在2010年寫下了第一行代碼,并在之后很長一段時間里潛心鉆研、精進技術(shù),經(jīng)受內(nèi)部場景的不斷磨煉。
2018年,四川農(nóng)商聯(lián)合銀行結(jié)合自身彈性業(yè)務(wù)、降本增效的需求,在2018年進行IT基礎(chǔ)設(shè)施架構(gòu)轉(zhuǎn)型時,決定向分布式架構(gòu)轉(zhuǎn)型。
在定下這一轉(zhuǎn)型戰(zhàn)略后,四川農(nóng)商聯(lián)合銀行發(fā)現(xiàn),當(dāng)時市面上可選的產(chǎn)品并不多,2018年3月啟動POC測試時,參與POC測試的團隊一共只有3個。
據(jù)四川農(nóng)商聯(lián)合銀行相關(guān)負責(zé)人回憶,當(dāng)時針對數(shù)據(jù)庫主要測試場景有三個,一是大規(guī)模并發(fā)交易響應(yīng)時間,二是容災(zāi)切換等異常場景的一致性,三是大規(guī)模集群管理能力。
“測試下來,OceanBase的性能表現(xiàn)最佳,這也是我們當(dāng)時選擇OceanBase的直接原因。”
隨后五年里,四川農(nóng)商聯(lián)合銀行一邊是新建系統(tǒng)全部采用新的分布式架構(gòu),另一邊也在推進存量系統(tǒng)大規(guī)模上云,并在2023年啟動了分布式核心建設(shè)。
如今四川農(nóng)商銀行已經(jīng)建立起三地四中心五節(jié)點多活架構(gòu),包括6大類業(yè)務(wù)49個應(yīng)用系統(tǒng)部署在了OceanBase上,OceanBase承載的日均交易量達到了8000萬元,日峰值交易量則達到1.3億元。
而在金融行業(yè),分布式數(shù)據(jù)庫替代集中式數(shù)據(jù)庫正在成為大勢所趨。
包括中國工商銀行、交通銀行、四川農(nóng)商聯(lián)合銀行、中國太平洋保險、招商證券等都已經(jīng)采用了OceanBase,OceanBase由此也成了金融行業(yè)承載關(guān)鍵業(yè)務(wù)負載的核心數(shù)據(jù)庫產(chǎn)品。
02 OceanBase沖出重圍
近日,OceanBase首次對外披露了金融行業(yè)營收:
2023年,OceanBase在金融行業(yè)營收達到了2.7億元,位列分布式數(shù)據(jù)庫獨立廠商之首。
這時的全球數(shù)據(jù)庫產(chǎn)業(yè)依然熱情高漲,市場上活躍著472家數(shù)據(jù)庫廠商,相關(guān)產(chǎn)品超過500款,即便是在國內(nèi),依然有超過150家廠商、238款產(chǎn)品同臺競爭。
OceanBase之所以能在激烈的競爭環(huán)境中有這樣的業(yè)務(wù)規(guī)模和市場地位,一方面是因為金融行業(yè)數(shù)字化轉(zhuǎn)型的特殊時代需求,另一方面則是由于OceanBase長達14年的技術(shù)積累。
作為國內(nèi)頭部保險公司,中國太平洋保險是在2021年開始轉(zhuǎn)向分布式數(shù)據(jù)庫的。
中國太平洋保險在經(jīng)歷了核心系統(tǒng)攻堅復(fù)雜場景打磨數(shù)據(jù)庫產(chǎn)品后,分布式數(shù)據(jù)庫成為金融行業(yè)數(shù)據(jù)庫應(yīng)用主流趨勢已經(jīng)漸趨明朗,OceanBase自2020年開始商業(yè)化運營后,也進入到了規(guī)?;茝V階段。
中國太平洋保險當(dāng)時結(jié)合自身業(yè)務(wù)特性,對市面上的數(shù)據(jù)庫業(yè)務(wù)進行了一系列評估,最終選擇了OceanBase作為轉(zhuǎn)向分布式數(shù)據(jù)庫的產(chǎn)品。
令中國太平洋保險數(shù)智研究院首席數(shù)據(jù)庫專家林春印象深刻的是,“由于保險業(yè)務(wù)復(fù)雜度高于銀行,業(yè)務(wù)與原有商業(yè)數(shù)據(jù)庫綁定程度也更深,因而對業(yè)務(wù)的平滑遷移要求很高。”
由于這也是OceanBase在誕生時要解決的關(guān)鍵問題之一,在攻堅這一問題后,強兼容性也成了OceanBase一項核心競爭力。
在中國太平洋保險轉(zhuǎn)向分布式數(shù)據(jù)庫時,OceanBase通過“全面語法兼容”,配合中國太平洋保險完成了“P17核心客戶服務(wù)系統(tǒng)”平滑遷移并在2022年底上線成功,截止目前已經(jīng)平穩(wěn)運行了500多天。
“能夠承載關(guān)鍵業(yè)務(wù)負載的數(shù)據(jù)庫不是在實驗室或辦公室中寫出來的,一定是在復(fù)雜業(yè)務(wù)場景中打磨出來的,”這是OceanBase副總裁、金融政企事業(yè)部總經(jīng)理王爽這些年在OceanBase商業(yè)化過程中最深刻的體會,也是數(shù)據(jù)庫產(chǎn)業(yè)的獨特之處。
在過去14年里,OceanBase不僅秉持根技術(shù)100%自研,在全球12個國家和地區(qū)拿下了500+項專利,還一步步從支撐自身電商業(yè)務(wù)、移動支付業(yè)務(wù)等內(nèi)部場景,到被越來越多金融機構(gòu)選擇。
據(jù)OceanBase官方公布數(shù)據(jù)顯示,如今已經(jīng)有70%千億資產(chǎn)規(guī)模以上銀行、75%頭部證券機構(gòu)、65%頭部保險機構(gòu)、45%頭部基金公司選擇了OceanBase進行核心系統(tǒng)升級。
來自市場調(diào)研機構(gòu)IDC的統(tǒng)計數(shù)據(jù)顯示,2023年中國金融行業(yè)分布式事務(wù)型數(shù)據(jù)庫市場規(guī)模為2.2億元,競爭格局基本穩(wěn)定,頭部5家廠商占據(jù)整體市場份額的86.9%。
其中,OceanBase以17.1%的市場位居獨立數(shù)據(jù)庫之首,僅次于三家云廠商。
不過,就金融行業(yè)而言,因其獨特的行業(yè)屬性,為了保障數(shù)據(jù)安全,核心交易系統(tǒng)只能以本地化方式部署,而本地化部署的應(yīng)用系統(tǒng)對分布式型數(shù)據(jù)庫建設(shè)要求往往要更高。
云廠商往往基于公有云開展數(shù)據(jù)庫業(yè)務(wù),因而,接下來獨立數(shù)據(jù)庫廠商之間的競爭將會決定未來金融行業(yè)數(shù)據(jù)庫產(chǎn)業(yè)分布格局。
就目前來看,在市場格局逐漸趨于穩(wěn)定的當(dāng)下,OceanBase以36.2%的市場份額位居國內(nèi)金融行業(yè)本地部署市場第一,在金融行業(yè)數(shù)據(jù)庫產(chǎn)業(yè)中已經(jīng)沖出重圍。
與此同時,這份由IDC在7月18日發(fā)布的市場調(diào)研報告,對中國金融行業(yè)分布式事務(wù)型數(shù)據(jù)庫市場還給出了一個重要判斷——技術(shù)驗證結(jié)束,迎接高速增長。
03 向分布式進發(fā)
金融行業(yè)的IT基礎(chǔ)設(shè)施技術(shù)驗證,往往由大行、股份制銀行代表的頭部機構(gòu)牽頭進行,城商行和省農(nóng)信由于技術(shù)實力上的差距,其中不少機構(gòu)在這個階段會先選擇觀望。
從IDC的調(diào)研數(shù)據(jù)來看,國內(nèi)6大行、12大股份制銀行向分布式事務(wù)型數(shù)據(jù)庫的改造工作的技術(shù)驗證已經(jīng)基本完成,隨著2024年改造步伐加快,預(yù)計進度在今年將達到65%-70%。
不過,在金融行業(yè)向分布式數(shù)據(jù)庫改造過程中,既有機遇,也存在挑戰(zhàn)。
降本增效是現(xiàn)在各行各業(yè)數(shù)字化轉(zhuǎn)型過程中面臨的最大挑戰(zhàn),對穩(wěn)定性、安全性優(yōu)先級高于成本敏感度的金融行業(yè)而言,接下來,也將面臨降本增效的問題。
OceanBase CEO楊冰在接受媒體采訪時指出,“當(dāng)行業(yè)逆風(fēng)開始縮減IT基礎(chǔ)設(shè)施成本開支時,更考驗數(shù)據(jù)庫廠商的核心競爭力,而OceanBase在降本方面有著極強的競爭力。”
以太平洋保險近期切換到OceanBase的核心業(yè)務(wù)之一——會計核算系統(tǒng)為例:
正是基于OceanBase高級壓縮技術(shù)對數(shù)據(jù)庫進行的“瘦身”,太平洋保險的存儲成本平均節(jié)省了80%以上,通過應(yīng)用模塊拆分和功能優(yōu)化,應(yīng)收結(jié)果統(tǒng)計模塊計算效率提升了2倍,升級后的應(yīng)用系統(tǒng)也實現(xiàn)了RP0=0,RTO<30s。
這樣的數(shù)據(jù)庫升級效果,是金融機構(gòu)快速向分布式數(shù)據(jù)庫轉(zhuǎn)型的主要原因,也正是在這樣的發(fā)展趨勢下,金融行業(yè)的數(shù)字化轉(zhuǎn)型走在了全行業(yè)前列。
據(jù)賽迪顧問軟件與信息服務(wù)業(yè)產(chǎn)業(yè)研究中心發(fā)布的《2022-2023年度中國平臺軟件市場研究報告》顯示,金融將超越電信與互聯(lián)網(wǎng)行業(yè),成為平臺軟件增長最快、規(guī)模最大的應(yīng)用市場。
本就對數(shù)據(jù)庫要求更高,再加上應(yīng)用成效突出、規(guī)模效益呈現(xiàn),這讓金融行業(yè)面向分布式數(shù)據(jù)庫的轉(zhuǎn)型,也將影響接下來整個數(shù)據(jù)庫產(chǎn)業(yè)的發(fā)展。
隨著金融行業(yè)分布式數(shù)據(jù)庫的大規(guī)模部署,分布式數(shù)據(jù)庫或?qū)⒂瓉硪惠喐笠?guī)模的產(chǎn)業(yè)大爆發(fā),作為原生分布式數(shù)據(jù)庫的頭號玩家,如今的OceanBase在承載金融行業(yè)關(guān)鍵業(yè)務(wù)轉(zhuǎn)型過程中,也正面臨著新的機遇和挑戰(zhàn)。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。
關(guān)注智造、硬件、機器人。