文|周雅
若是用技術的語言來表達,這就是物理世界「圖數(shù)據(jù)庫」的概念。
說到這套技術,就不得不提一家公司——Neo4j。
2000年的某天,瑞典人Emil Eifrem坐飛機飛往孟買,當他正在為解決數(shù)據(jù)系統(tǒng)的性能問題發(fā)愁時,突然靈感乍現(xiàn),隨手抓起一張餐巾紙,迅速勾勒出一個圖數(shù)據(jù)庫模型。當時的Emil Eifrem或許并不會想到,那張餐巾草圖會是一家公司的開端。
2007年,懷揣「圖數(shù)據(jù)庫」理想的Neo4j公司正式在瑞典成立了。十幾年之后,Neo4j公司已經(jīng)成為全球領先的圖數(shù)據(jù)庫平臺,服務全球400多家企業(yè)客戶(包括空客、康卡斯特、eBay、美國宇航局、瑞銀、沃爾瑪?shù)龋鴵頂?shù)百萬社區(qū)用戶。
關系型數(shù)據(jù)庫沒有關系,它純粹就是數(shù)據(jù);圖數(shù)據(jù)庫存的不是圖,它存的是關系。”
「圖數(shù)據(jù)庫」,是以圖的結構形式來存儲數(shù)據(jù),它所存儲的就是聯(lián)系的數(shù)據(jù),是關聯(lián)數(shù)據(jù)本身。
“圖數(shù)據(jù)庫的美妙之處在于,它基本上適合于每一個行業(yè)。”
此外在Neo4j 社區(qū),也一直在用圖數(shù)據(jù)庫技術解決一些社會緊迫問題:比如氣候變化、癌癥治療、加速人類的火星之旅、推進性別平等、提高政府透明度、以及推動人類知識的邊界等。
持久互信的商業(yè)關系,也是職業(yè)與業(yè)務可持續(xù)發(fā)展的關鍵。
以下是科技行者訪談Neo4j亞太區(qū)副總裁Nik Vora的實錄(經(jīng)整理):
“關系型數(shù)據(jù)庫沒有關系,圖數(shù)據(jù)庫存的是關系”
科技行者:Neo4j成立于2000年,公司成立之初,整個市場環(huán)境是怎么樣的?
Nik Vora:2000年的時候,Neo4j創(chuàng)始人萌生了一個(做圖數(shù)據(jù)庫的)想法,并成立了公司,但想法只停留在理論階段,而真正把想法付諸于實施、變成商業(yè)化落地的產(chǎn)品是在2007年。當時,我們的創(chuàng)始人在飛機上,提出了具體的想法,并且和伙伴們把它付諸實施。
2007年,面臨的第一個挑戰(zhàn)就是,怎么把它做一個技術的歸類和分類。因為在那個時候,剛開始在美國和歐洲市場,基本上很多客戶無論是大學里面學的、還是現(xiàn)實用的都是「關系型數(shù)據(jù)庫」,他們很疑惑為什么這么一個小公司過來給我講「圖數(shù)據(jù)庫」,它到底是做什么用的?這是當時最大一個挑戰(zhàn),在于普及。
Neo4j創(chuàng)始人和初創(chuàng)團隊都是開發(fā)者,所以我們剛開始的產(chǎn)品版本,是OpenSource(開源)的方式,通過發(fā)展社區(qū),社區(qū)的開發(fā)者們都可以對這個OpenSource做貢獻,讓大家更多地去了解什么是圖數(shù)據(jù)庫。現(xiàn)在在亞洲,可以看到很多開源社區(qū)的貢獻者。
科技行者:既然當時市場的主流是「關系型數(shù)據(jù)庫」,那為什么Neo4j會看好「圖數(shù)據(jù)庫領域」呢?
Nik Vora:當初的市場環(huán)境主要是關系型數(shù)據(jù)庫,但隨著互聯(lián)網(wǎng)尤其是移動互聯(lián)網(wǎng)的發(fā)展,大量數(shù)據(jù)涌現(xiàn),關系型數(shù)據(jù)庫已滿足不了客戶的需求。Neo4j看到市場的這種需求,并投身到圖數(shù)據(jù)庫這個領域。
在傳統(tǒng)的關系型數(shù)據(jù)庫里,要找到一個人,需要找數(shù)據(jù)之間的關系,可能要花費幾天的時間去做關聯(lián)。但是在圖數(shù)據(jù)庫里,發(fā)現(xiàn)可以做到毫秒級,相對于傳統(tǒng)的關系型數(shù)據(jù)庫,它的作用在于——發(fā)現(xiàn)數(shù)據(jù)之間的關系。
所以說,關系型數(shù)據(jù)庫沒有關系,它純粹就是數(shù)據(jù);圖數(shù)據(jù)庫存的不是圖,它存的是關系。
科技行者:目前看來,圖數(shù)據(jù)庫主要用在哪些行業(yè),可否描述一下具體的應用場景?
Nik Vora:圖數(shù)據(jù)庫基本上適合于每一個行業(yè)?;乜催^去一兩年,中國變成了這一行業(yè)里的開路先鋒,在圖數(shù)據(jù)庫的推廣方面,很多中國的客戶都在試用。
當然了,一些行業(yè)的普及程度會比另外一些行業(yè)高,比如執(zhí)法部門。譬如,A認識B,通過圖數(shù)據(jù)庫,如果A是一個嫌疑人,而A與B之間已經(jīng)有認識關系的話,那B也很有可能變成一個嫌疑人。通常,執(zhí)法機關在處理移民工作中,大量地使用了人和人之間的關系。
還有諸如航空公司、運輸公司(比如滴滴出行),都廣泛的應用圖數(shù)據(jù)庫:分析一個乘客從A處到B處,一些航空公司都是用數(shù)據(jù)庫表現(xiàn)出來,非常方便;還有銀行里面欺詐檢測和反洗錢這些場景也非常適合,尤其今天我們看到反欺詐呈一個上升趨勢,欺詐者變得越來越聰明,銀行再用傳統(tǒng)的方式很難發(fā)現(xiàn)他,而通過圖數(shù)據(jù)技術,可以把人和人之間的關系,把邏輯事件指出來,很容易就發(fā)現(xiàn)新型的欺詐關系;另外在保險行業(yè),圖數(shù)據(jù)庫也非常流行,因為保險的欺詐也很多。
圖數(shù)據(jù)庫在制造業(yè)也有廣泛的應用。比如汽車制造業(yè),一輛汽車有很多的零件,一個零件壞了之后,它會影響上下游的關系,比如一個小零件壞了,可能影響到發(fā)動機的最大功率,通過圖數(shù)據(jù)庫,很容易把所有零部件之間的各種關系串起來。
智能手機行業(yè)也同理。手機零部件,如果用圖數(shù)據(jù)庫把它關聯(lián)起來,很容易發(fā)現(xiàn)中間極小的問題,甚至產(chǎn)生蝴蝶效應,一個小螺絲釘壞了有可能會影響到顯示屏幕,此前沒有圖數(shù)據(jù)庫,是很難去發(fā)現(xiàn)這些問題的。
其他包括醫(yī)療等很多重要行業(yè)在內的千行百業(yè),都在使用圖數(shù)據(jù)庫。
“說明我們當時做了一件對的事情”
科技行者:在圖數(shù)據(jù)庫領域,有很多巨頭和玩家先后進入,相比之下,Neo4j的核心優(yōu)勢是什么?
Nik Vora:首先我們很高興看到市場上面有很多的競爭對手出來,這說明我們當時做了一件對的事情。
Neo4j的核心優(yōu)勢有三方面:
開源。讓更多人可以使用。
目前在圖數(shù)據(jù)科學方面,Neo4j已經(jīng)積累了60多種不同的算法,可以幫助用戶獲得最大程度的投資回報。
比如國內最大的某個制造廠商,在擴展性、速度方面,只有Neo4j可以滿足它的需求。
科技行者:這些數(shù)據(jù)的隱私安全方面怎么保障呢?
Nik Vora:數(shù)據(jù)的合規(guī)、安全、隱私是一個非常重要的話題,Neo4j也充分地考慮到這一點。
除了開源版,Neo4j還有企業(yè)版,有非常重要的一些安全特性,可以幫助企業(yè)保護隱私和數(shù)據(jù)安全。比如基于角色實現(xiàn)安全控制,什么樣的人可以訪問哪些數(shù)據(jù),什么樣的人只能讀取但不可以修改數(shù)據(jù)等等。還有通過加密保護保存在數(shù)據(jù)中心的一些數(shù)據(jù)。
科技行者:Neo4j的客戶也很強勢,比如NASA、沃爾沃、瑞銀等等,可否舉例描述一下,這些客戶找到你們,主要的訴求是什么?
Nik Vora:我們很榮幸有這些客戶。以NASA為例,NASA有數(shù)以千計的數(shù)據(jù)中心,NASA的科學家或工程師之前找數(shù)據(jù)非常困難,因為有太多的文檔,查找極其耗時。NASA登陸火星項目應用了Neo4j,創(chuàng)建了知識圖譜,把上億信息關聯(lián)起來,方便工程師,將項目縮短了兩年的時間,能提前完成項目并節(jié)省成本。
中國很多公司也在投入和學習知識圖譜。在中國很多大型機構,知識圖譜都是非常流行的一個應用,大家投入很多的精力去學習,甚至已經(jīng)開始研究知識圖譜如何幫助企業(yè)。Neo4j在中國已經(jīng)積累了很多客戶,包括來自電信、銀行、金融、制造行業(yè)的領先公司。
“中國創(chuàng)新勢頭更強勁”
科技行者:相比之下,在圖數(shù)據(jù)庫領域,中國市場和國外市場存在哪些異同之處?
Nik Vora:在應用上差不多。市場方面,中國有幾處不同:1)中國創(chuàng)新勢頭強勁;2)互聯(lián)網(wǎng)的應用更廣泛,規(guī)模更大,特別是移動互聯(lián)網(wǎng);3)云。中國70%應用在云上。
科技行者:您工作過的幾個國家很有特色,比如新加坡、悉尼、孟買和上海,中國在工作環(huán)境上,與它們有何區(qū)別?
Nik Vora:如果中國客戶喜歡你的產(chǎn)品,會很快采用。而且中國客戶注重產(chǎn)品的本地化,滿足本地化需求。
科技行者:6月份,Neo4j剛剛拿到3.25億美元F輪融資,你們吸引投資人的秘訣是什么?
Nik Vora:投資者對我們都是長期投資。我們把投資者視為合作伙伴。
我們吸引投資人之處主要在于:1)我們是市場上排名第一的廠商; 2) 我們擁有成千上萬的開發(fā)者社區(qū);3)我們和投資人有著共同的價值觀和愿景。
公司最新一輪的3.25億美金的融資,不僅僅是在圖數(shù)據(jù)庫領域,實際上在所有數(shù)據(jù)庫歷史記錄里,這都是最大的一筆融資。
科技行者:Neo4j將如何消化這筆融資?
Nik Vora:1) 加速市場擴張,比如中國和其他市場;2)繼續(xù)投資圖數(shù)據(jù)庫和數(shù)據(jù)科學;3)持續(xù)成為處理萬億節(jié)點的市場領導者。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結合大語言模型的敘事推理能力與音頻生成技術,通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠將復雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術,通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術僅需添加兩個線性層就能大幅提升運動質量,在多項測試中超越包括Sora在內的商業(yè)模型,為AI視頻生成的實用化應用奠定了重要基礎。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質量管控方法,讓AI在保持技術能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內完成10天全球天氣預報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡技術,通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學領域帶來了效率和精度的雙重突破。
關注科技創(chuàng)新、技術投資。
以文會友,左手硬核科技,右手浪漫主義。