科技行者 10月15日 杭州消息(文/周雅):Michael “Monty” Widenius 又一次來中國了,身為 MySQL 之父、MariaDB 創(chuàng)始人,50多歲的他仍然奮戰(zhàn)在代碼第一線,他近幾年頻繁活躍于中國數(shù)據(jù)庫圈子,這一切很大程度都是因為開源,因為阿里云。
見到Monty的這天,他剛剛結(jié)束2018杭州云棲大會·數(shù)據(jù)庫開發(fā)者生態(tài)峰會的演講,與阿里云數(shù)據(jù)庫事業(yè)部總經(jīng)理鳴嵩一起,宣布“阿里云正式上線企業(yè)版MairaDB”的消息,此消息意義重大,因為這是MairaDB為阿里云打造的唯一一個企業(yè)版。
未來10年,毫無疑問是數(shù)據(jù)爆炸式增長的10年,面對諸如大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)等應(yīng)用場景,云數(shù)據(jù)庫就是背后的技術(shù)要塞。對企業(yè)而言,如何走在云時代的前列,選對數(shù)據(jù)庫是當(dāng)務(wù)之急。
熟悉MairaDB的人都知道,它是MySQL源代碼的一個分支。Monty離開自己一手開發(fā)的 MySQL 之后,創(chuàng)辦了MairaDB,兩個數(shù)據(jù)庫管理系統(tǒng)最大的區(qū)別在于,后者更加符合“開源”精神。
而MariaDB的確實表現(xiàn)不俗,連續(xù)5年蟬聯(lián)年度Linux用戶數(shù)據(jù)庫選擇獎(2013年-2017年),在 DB-Engines 的數(shù)據(jù)庫管理系統(tǒng)位列14(2018年9月排名),且一直處于攀升趨勢。
數(shù)據(jù)來自于DB-Engines 數(shù)據(jù)庫管理系統(tǒng)2018年9月榜單
上圖可以總結(jié)出兩個數(shù)據(jù)庫趨勢:
· 目前榜單上的開源數(shù)據(jù)庫系統(tǒng)與商業(yè)數(shù)據(jù)庫系統(tǒng)平分秋色。
· 在通用領(lǐng)域,完全不屬于任何組織的開源數(shù)據(jù)庫與自研數(shù)據(jù)庫將是未來的主流,這也是MariaDB得到廣泛關(guān)注的原因,阿里、英特爾、騰訊都先后贊助了MariaDB。
MariaDB的誕生也與開發(fā)者一脈相承,它在大多數(shù)開發(fā)者眼中既是一個“有情懷”的數(shù)據(jù)庫,也是更友好的數(shù)據(jù)庫——大部分兼容MySQL,堅持開源,擁抱社區(qū)。比如引入FaceBook rocksdb做為主引擎,引入infinidb的columstore作為列存,在server層做行列存的整合,引入spider解決分布問題,貢獻了maxscale中間件,特別是10.3版本動作很大(阿里云上線的正是企業(yè)版MairaDB 10.3版本)。
鳴嵩說MariaDB是“對開發(fā)者更友好的數(shù)據(jù)庫”
開源雖好,但是很多開源平臺也會面臨在企業(yè)應(yīng)用時,不易用、不好用的問題。Monty和鳴嵩都做了強調(diào),企業(yè)版MariaDB會有一些優(yōu)化的功能,領(lǐng)先社區(qū)版三年。
這次雙方共同推出的企業(yè)版MairaDB號稱為“開源價值最大化”,我們可以理解為“一勞永逸的數(shù)據(jù)庫”。在鳴嵩的解讀下,企業(yè)一旦購買MairaDB,阿里云將額外提供備份、診斷、升級等運維服務(wù),相當(dāng)于擁有了阿里巴巴多年在數(shù)據(jù)庫積累的運維經(jīng)驗。
MariaDB本身也為企業(yè)級市場不斷進化。比如MariaDB在歐洲服務(wù)企業(yè)級客戶時,發(fā)展出窗口函數(shù)等針對性功能。
鳴嵩還介紹了更多針對企業(yè)級數(shù)據(jù)安全方面的優(yōu)化。比如用戶訪問數(shù)據(jù)庫,它的鏈路是要SSL加密的;另外,存儲引擎有兩層加密,一是數(shù)據(jù)庫引擎的加密(原始的數(shù)據(jù)加密后存在存儲介質(zhì)上),第二是存儲介質(zhì)本身自帶加密能力。“這些東西讓你的數(shù)據(jù)庫非常的安全”,鳴嵩說。
這些功能,也讓開發(fā)者更方便的操縱自己的數(shù)據(jù)庫,這就是MariaDB今天的價值,同時也是阿里云在服務(wù)客戶時的追求的核心訴求和理念——優(yōu)秀的產(chǎn)品,便捷的使用。
能和MariaDB實現(xiàn)默契的配合,也和阿里云對開源的熱情和努力分不開。鳴嵩談起阿里云的開源成績,就像數(shù)落自家院子里的果樹。
阿里云多年來在開源市場,過去十年一直致力于中國和世界的開源事業(yè)。在開源中國舉行的“2017年度最受歡迎中國開源軟件Top20”的評選中,阿里巴巴占據(jù)五席;GitHub評選2017年對GitHub貢獻最大的十家公司榜單當(dāng)中,只有阿里巴巴一家中國公司。
GitHub評選2017年對GitHub貢獻最大的十家公司榜單
阿里云對于開源的熱愛,從它對MariaDB的貢獻可見一斑,也可以從兩者源遠(yuǎn)流長的合作歷史說起。
Monty本人與阿里云的合作可謂由來已久。早在2008年,阿里云就一直與MySQL社區(qū)合作不斷。而2012年開始,阿里云就開始了對MariaDB項目的貢獻,當(dāng)前MariaDB中的多源復(fù)制,線程內(nèi)存監(jiān)控,數(shù)據(jù)閃回等重要功能,都是來自阿里云的貢獻。尤其在AliSQL開源之后,大量AliSQL中的先進功能正在快速的合并進入MariaDB。
目前阿里巴巴已經(jīng)有150+個開源項目,其中數(shù)個項目 star 破萬。
做了這么多貢獻,但是據(jù)阿里方面表示,阿里巴巴并沒有開源項目的KPI考核,各個團隊都是發(fā)自內(nèi)心地將踩過的坑和總結(jié)的經(jīng)驗融入到開源項目中,供業(yè)界所有人使用,希望幫助他人解決問題。
Monty也認(rèn)可阿里云的文化和基因,用他的話來說:“兩個一起合作比單槍匹馬要好一些”,并且毫不掩飾對于阿里云的賞識,他回憶,自己經(jīng)常因為阿里云來到中國,去年還被邀請參加阿里云內(nèi)部的組織開發(fā)會議、了解各個項目:“阿里云的開發(fā)組非常得力,是非常優(yōu)秀的開發(fā)組”。
這正是社區(qū)一致的開源精神,大家都可以站在巨人的肩膀上,每個人都可以既是老師又是學(xué)生,這或許可以解釋為什么技術(shù)的發(fā)展能如此充滿活力。
碼代碼之余,Monty也有一顆熱愛生活的心。據(jù)鳴嵩透露,Monty酒量非常的好,上一次來中國給阿里云的同事帶了很多酒,以及“茴香味的巧克力”。Monty聽了之后笑笑說道:“不過,寫代碼的時候不要喝酒”。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會友,左手硬核科技,右手浪漫主義。