支付寶崩了?無法正常支付、“網(wǎng)絡(luò)繁忙,請稍后再試”狀況
值得注意的是,2018年的阿里云棲大會ATEC主論壇上,螞蟻金服副CTO胡喜對外鄭重推出支付寶架構(gòu)“三地五中心”、具備秒級自愈力的容災(zāi)解決方案。
彼時(shí),在云棲大會現(xiàn)場進(jìn)行了一次特別技術(shù)演練:兩名支付寶工程師在胡喜的指揮下,同時(shí)剪斷了支付寶兩個(gè)模擬機(jī)房的網(wǎng)線,在 40% 的服務(wù)器在突然無法工作的情況下,只用了 26 秒,運(yùn)行在上面的支付寶虛擬賬戶便恢復(fù)了正常運(yùn)轉(zhuǎn),實(shí)現(xiàn)自愈,用戶資金、數(shù)據(jù)零丟失。
據(jù)介紹,在這一過程中,他們基于支付寶的真實(shí)架構(gòu)系統(tǒng),在兩個(gè)城市單獨(dú)搭建了模擬機(jī)房;在模擬兩處機(jī)房同時(shí)終止服務(wù)時(shí),架構(gòu)在模擬環(huán)境中的支付寶虛擬賬戶,僅經(jīng)歷了26秒的短暫故障,便重回正常狀態(tài)。
胡喜稱,得益于“三地五中心”容災(zāi)系統(tǒng),即使在真實(shí)環(huán)境下,如果支付寶部署在兩個(gè)城市的兩個(gè)機(jī)房同時(shí)出問題,跑在這兩個(gè)機(jī)房上的支付寶賬戶恢復(fù)正常的速度是分鐘級。
“三地五中心”機(jī)房架構(gòu),即在三座城市部署五個(gè)機(jī)房,一旦其中一個(gè)或兩個(gè)機(jī)房發(fā)生故障,支付寶的底層技術(shù)系統(tǒng)會將故障城市的流量全部切換到運(yùn)行正常的機(jī)房,并且能做到數(shù)據(jù)保持一致且零丟失。而相比之下,目前互聯(lián)網(wǎng)和金融科技行業(yè)普遍采用的是比此低一級“兩地三中心”部署架構(gòu),即在一個(gè)城市設(shè)兩個(gè)機(jī)房,在另一個(gè)城市設(shè)一個(gè)冷備機(jī)房。
今年雙十一期間,天貓淘寶每秒交易創(chuàng)建峰值54.5萬筆、實(shí)時(shí)計(jì)算消息處理峰值25.51億條/秒,而用戶在購物支付中未感受到抖動、流暢平穩(wěn)。作為交易的基礎(chǔ),胡喜介紹,今年雙11,支付寶技術(shù)自主研發(fā)的技術(shù)之一、分布式數(shù)據(jù)庫OceanBase再次刷新數(shù)據(jù)庫處理峰值,達(dá)6100萬次每秒。