5月27日支付寶才因?yàn)楣饫w事件一度導(dǎo)致應(yīng)用無法使用,第二天,5月28日攜程又遭遇攻擊,連續(xù)兩天,大型互聯(lián)網(wǎng)公司出現(xiàn)不同的系統(tǒng)事故,“互聯(lián)網(wǎng)+”浪潮下的安全問題再次受到行業(yè)內(nèi)外拷問。
根據(jù)攜程官方的最新回應(yīng):經(jīng)技術(shù)排查,確認(rèn)此次事件是由于員工錯(cuò)誤操作,刪除了生產(chǎn)服務(wù)器上的執(zhí)行代碼導(dǎo)致,攜程也再次保證,數(shù)據(jù)和數(shù)據(jù)庫并未受到此次事件的影響,用戶訂單數(shù)據(jù)也完整無損,請(qǐng)用戶放心并繼續(xù)使用攜程網(wǎng)站及App,并表示其在系統(tǒng)上做了改進(jìn),規(guī)范并杜絕技術(shù)人員錯(cuò)誤刪除生產(chǎn)服務(wù)器上代碼的操作。
攜程在微博上的回應(yīng)內(nèi)容
到底是個(gè)怎么樣的內(nèi)部失誤呢?
為什么恢復(fù)的如此緩慢?之前也有業(yè)內(nèi)人士指出,除了攜程涉及較多業(yè)務(wù)和應(yīng)用外,在平時(shí)的運(yùn)維過程中,對(duì)于常見的故障都會(huì)有應(yīng)急預(yù)案。但像攜程這次所有系統(tǒng)包括數(shù)據(jù)庫都需要重新部署的極端情況,顯然不可能在應(yīng)急預(yù)案的范疇中。在倉促上陣應(yīng)急的情況下,技術(shù)方案的評(píng)估和選擇問題,不同技術(shù)崗位之間的管理協(xié)調(diào)的問題,不同應(yīng)用系統(tǒng)之間的耦合和依賴關(guān)系,還有很多平時(shí)欠下的技術(shù)債都集中爆發(fā)了,更不用說很多不常用的子系統(tǒng),可能上線之后就沒人動(dòng)過,一時(shí)半會(huì)都找不到能處理的人。更要命的是,網(wǎng)站的核心系統(tǒng),可能會(huì)寫死依賴了這個(gè)平時(shí)根本沒人關(guān)注的應(yīng)用,想繞開邊緣應(yīng)用只恢復(fù)核心業(yè)務(wù)都做到。更別說在這樣的高壓之下,各種噪音和干擾很多,運(yùn)維工程師的反應(yīng)也沒有平時(shí)靈敏。
簡單的說,就算所有代碼和數(shù)據(jù)庫的備份都存在,想要快速恢復(fù)業(yè)務(wù),甚至比從0開始重新搭建一個(gè)攜程更困難。
多備份聯(lián)合創(chuàng)始人胡茂華向發(fā)表文章表示:“我記得當(dāng)初在1號(hào)店負(fù)責(zé)運(yùn)維時(shí),因?yàn)?號(hào)店被沃爾瑪收購,作為上市企業(yè)的關(guān)聯(lián)交易公司,當(dāng)時(shí)沃爾瑪派KPMG來做詳細(xì)的審計(jì),核心崗位和管理層都被做了訪談,并出具了詳細(xì)的操作流程,我親自參與這個(gè)過程,審計(jì)是做了,但我們作為執(zhí)行人心中是非常沒有底氣的。在我呆過的幾個(gè)大的互聯(lián)網(wǎng)公司如騰訊、盛大和1號(hào)店,都有做數(shù)據(jù)管理流程和備份恢復(fù)服務(wù),但是因?yàn)檫@些安全業(yè)務(wù)比較邊緣,在整個(gè)公司關(guān)注程度很低,并沒有落到實(shí)處。”
他還說到,有理由相信,所有的公司都有做數(shù)據(jù)管理和備份,不論是小微企業(yè)老板自己手動(dòng)用U盤或者硬盤拷貝、還是大的互聯(lián)網(wǎng)公司有專門的運(yùn)維人員專項(xiàng)負(fù)責(zé)、傳統(tǒng)的中大型企業(yè)用專業(yè)的軟硬件工具,關(guān)鍵是99%的公司都沒有做數(shù)據(jù)管理流程、備份和恢復(fù)的演練,恢復(fù)的數(shù)據(jù)到底可不可用,如何快速的恢復(fù)等操作演練。
為什么恢復(fù)時(shí)間那么長?
對(duì)于為何12小時(shí)后才恢復(fù)正常,攜程解釋稱:類似攜程這樣的大型網(wǎng)站承載著繁多業(yè)務(wù),其后臺(tái)是一個(gè)由SOA(面向服務(wù))架構(gòu)組成的龐大服務(wù)器集群,看似簡單的一個(gè)頁面背后由上千個(gè)應(yīng)用子系統(tǒng)以及上千個(gè)WebService組成,而每個(gè)應(yīng)用子系統(tǒng)和每個(gè)WebService之間都存在著相互調(diào)用的依賴關(guān)系。
發(fā)生事件后,攜程的技術(shù)人員除了需要恢復(fù)生產(chǎn)服務(wù)器上的執(zhí)行代碼以外,還需要做的是恢復(fù)并確保每個(gè)應(yīng)用子系統(tǒng)以及每個(gè)Web Service的功能正常,同時(shí)確保應(yīng)用子系統(tǒng)與Web Service間的調(diào)用關(guān)系得以正常執(zhí)行。
這種驗(yàn)證性的操作需要攜程的工程師及運(yùn)維人員通力合作,盡快恢復(fù)生產(chǎn)代碼并通過反復(fù)地、持續(xù)性地調(diào)試以確保應(yīng)用子系統(tǒng)與Web Service功能的正常運(yùn)行。
攜程再次保證,數(shù)據(jù)和數(shù)據(jù)庫并未受到此次事件的影響,用戶訂單數(shù)據(jù)也完整無損,請(qǐng)用戶放心并繼續(xù)使用攜程網(wǎng)站及App。
攜程官方網(wǎng)站及APP已于28日23:29全面恢復(fù)正常。對(duì)用戶造成的不便,攜程再次深表歉意。”這也是繼2014年春節(jié)期間攜程被爆網(wǎng)站存在漏洞之后,連續(xù)兩年遭遇IT系統(tǒng)上的漏洞問題。此次事故除了導(dǎo)致攜程的股價(jià)應(yīng)聲大跌外,按照攜程一季度財(cái)報(bào)公布的數(shù)據(jù),攜程宕機(jī)的損失為平均每小時(shí)106.48萬美元。對(duì)此這次事故的損失,大家算算吧!
雖然攜程連續(xù)回應(yīng)稱此次事故是由于員工操作失誤導(dǎo)致,也得到了很多人的認(rèn)同。但在事件發(fā)生時(shí),攜程卻說由于不明攻擊所致,這樣的前后說法相差甚遠(yuǎn)。
消失的微博,這是28日12:50攜程的回應(yīng),如今卻已刪除
這讓起先不明真相的筆者不得不驚呼,我們不僅要問,攜程你到底有沒有譜!
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。