一、資損防控介紹
得物提供大量商品買賣等服務(wù),資金流轉(zhuǎn)量大,任何由于設(shè)計缺陷、系統(tǒng)缺陷、系統(tǒng)故障、人為操作、安全漏洞等因素都會引發(fā)直接或間接資金損失。資損防控就是在項目全生命周期內(nèi),引入多種資金分析和控制手段,預(yù)防資損故障或控制資損故障影響范圍。YlQ28資訊網(wǎng)——每日最新資訊28at.com
那么在日常工作中,具體如何開展呢?主要可以從以下三個方面來做:YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
1.機(jī)制流程建設(shè)
YlQ28資訊網(wǎng)——每日最新資訊28at.com
在業(yè)務(wù)項目開始時,我們應(yīng)該評定項目資金風(fēng)險等級,比如高風(fēng)險需要重點關(guān)注&投入,中風(fēng)險需要投入多少資源,低風(fēng)險又如何保障。YlQ28資訊網(wǎng)——每日最新資訊28at.com
在項目資金風(fēng)險評定后,產(chǎn)品架構(gòu)設(shè)計時需要包括技術(shù)風(fēng)險設(shè)計,比如冪等、分布式數(shù)據(jù)一致性、異地多活等。YlQ28資訊網(wǎng)——每日最新資訊28at.com
然后對于高資金風(fēng)險項目,我們需要出專門的資金風(fēng)險系分,在得物重點關(guān)注資金流、信息流以及物流的流轉(zhuǎn),比如業(yè)務(wù)的高保鏈路是怎么樣的,有哪些資損風(fēng)險點等。YlQ28資訊網(wǎng)——每日最新資訊28at.com
接下來就是對輸出的資損風(fēng)險點進(jìn)行布防,布防的形式主要是核對和監(jiān)控,核對為主,監(jiān)控作為兜底,因為前面輸出的資損風(fēng)險點可能會有遺漏,監(jiān)控是業(yè)務(wù)異常的感知手段。日常我們也可以通過混沌工程進(jìn)行風(fēng)險挖掘&核對規(guī)則驗證。YlQ28資訊網(wǎng)——每日最新資訊28at.com
最后我們需對資損風(fēng)險告警進(jìn)行應(yīng)急,拉起應(yīng)急小組排查確認(rèn)風(fēng)險并修復(fù)。YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
2.人員陣型建設(shè)
YlQ28資訊網(wǎng)——每日最新資訊28at.com
資損防控并不是靠某一個角色來承擔(dān),而是需要架構(gòu)、研發(fā)、質(zhì)量和SRE一起來防控并嵌入日常工作流程中,從組織架構(gòu)視角,我們需要建立至少三道防線,即研發(fā)防線,質(zhì)量防線和SRE防線,相互兜底,合并共舉達(dá)到資損防控的目的。當(dāng)然各角色在項目各個階段各有側(cè)重,比如SRE負(fù)責(zé)業(yè)務(wù)線上穩(wěn)定性,那么線上的資損防控投入相對大一些。YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
3.多體系防控
YlQ28資訊網(wǎng)——每日最新資訊28at.com
從發(fā)現(xiàn)資損風(fēng)險時效視角來說,可以分為實時核對(T+0)、近實時核對(T+M)、離線核對(T+H, T+1),每種核對方式都有其適配的業(yè)務(wù)場景,并不存在替代之說,比如不落庫的配置變更適用實時核對,業(yè)務(wù)定時任務(wù)適用離線核對等等。實際業(yè)務(wù)場景布防時需分析業(yè)務(wù)特點,然后再使用合適的核對體系工具。在組織分工方面,研發(fā)側(cè)重離線核對,測試側(cè)重近實時核對,SRE側(cè)重實時核對,當(dāng)然實際工作中并不必這么界線分明,自己看到的風(fēng)險點,可以選用合適的工具體系。YlQ28資訊網(wǎng)——每日最新資訊28at.com
從核對是否影響業(yè)務(wù)運(yùn)行視角看,可以分為旁路核對和主路核對,旁路核對的結(jié)果對業(yè)務(wù)運(yùn)行不構(gòu)成影響,僅僅是風(fēng)險揭示,而主路核對是有能力影響業(yè)務(wù)運(yùn)行的,比如資損熔斷用的就是主路核對技術(shù),在核對告警報出后中斷業(yè)務(wù)運(yùn)行。目前公司已有的A、B平臺都屬于旁路核對體系。YlQ28資訊網(wǎng)——每日最新資訊28at.com
在布防核對規(guī)則后,我們怎么檢驗布防的有效性,同時因為業(yè)務(wù)迭代發(fā)展,早前布防的核對規(guī)則需要調(diào)整核對邏輯來適配新的業(yè)務(wù)邏輯,也就是說我們?nèi)绾伪ur核對規(guī)則?這就需要混沌工程資損演練來支撐了。資損演練又分為有損演練和無損演練,比如在線上搞有損演練時經(jīng)常把金額數(shù)據(jù)加/減0.01,檢驗布防的核對規(guī)則是否發(fā)現(xiàn),這樣即使發(fā)生了實際資損也在演練預(yù)算可以覆蓋的范圍內(nèi),但在線上搞有損演練需謹(jǐn)慎評估影響范圍。資損防控?zé)o損演練關(guān)鍵在于生產(chǎn)庫的克隆,這樣在演練時做數(shù)據(jù)篡改并不影響線上業(yè)務(wù)運(yùn)行。YlQ28資訊網(wǎng)——每日最新資訊28at.com
二、資損防控技術(shù)體系
我們在做資損防控時,最重要的一步是風(fēng)險識別,它是資損核對布防的源頭,可以這么說,如果沒有風(fēng)險識別就沒有接下來核對布防。風(fēng)險識別可以通過人工分析和智能系統(tǒng)推導(dǎo)兩種方式得到,從建設(shè)發(fā)展階段來說,人工分析通常是最開始采用的方式,在這個基礎(chǔ)上,再通過算法推導(dǎo)+專家經(jīng)驗發(fā)展出智能系統(tǒng)推導(dǎo)。下面依人工分析視角來展開,這里舉例一個簡化版得物系統(tǒng)的資損防控如何做。如下圖所示,左邊為商品交易業(yè)務(wù)鏈路,其中包括用戶下單交易和運(yùn)營配置商品:YlQ28資訊網(wǎng)——每日最新資訊28at.com
圖片YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
2.T+M核對
YlQ28資訊網(wǎng)——每日最新資訊28at.com
通過數(shù)據(jù)庫Binlog可以實現(xiàn)分鐘級的資損核對,這種核對方式對于業(yè)務(wù)上下游一致性風(fēng)險有非常好的發(fā)現(xiàn)能力,日常配合混沌工程的無損演練能力,對于未覆蓋到資損風(fēng)險也可以很好的揭示出來,所以T+M核對適用于涉數(shù)據(jù)庫字段的一致性風(fēng)險、蓋帽等業(yè)務(wù)場景。YlQ28資訊網(wǎng)——每日最新資訊28at.com
圖片YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
3.T+0核對
YlQ28資訊網(wǎng)——每日最新資訊28at.com
隨著業(yè)務(wù)的發(fā)展,對于資損核對也提出更高要求,我們需要發(fā)展出實時核對能力。比如可以通過業(yè)務(wù)插樁的方式來實現(xiàn)同步/異步觸發(fā),同時實時監(jiān)聽業(yè)務(wù)執(zhí)行消息,然后數(shù)據(jù)路由至具體業(yè)務(wù)域執(zhí)行核對邏輯,這種核對方式屬資損防控領(lǐng)域的重武器,適用于業(yè)務(wù)型風(fēng)險、配置型風(fēng)險,同時滿足復(fù)雜業(yè)務(wù)核對場景。目前SRE已經(jīng)在建設(shè)T+0實時核對系統(tǒng)。YlQ28資訊網(wǎng)——每日最新資訊28at.com
圖片YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
4.資損演練
YlQ28資訊網(wǎng)——每日最新資訊28at.com
資損演練可以驗證布防的核對規(guī)則有效性,又可以用來挖掘未覆蓋到資損風(fēng)險,所以資損演練是資損防控體系很重要的一環(huán)。資金無損演練有以下三個關(guān)鍵點:YlQ28資訊網(wǎng)——每日最新資訊28at.com
- 資損防控落地的規(guī)則都是針對業(yè)務(wù)數(shù)據(jù)來執(zhí)行的
- 資損防控?zé)o損演練的數(shù)據(jù)來自生產(chǎn)環(huán)境
- 無損演練數(shù)據(jù)與生產(chǎn)環(huán)境數(shù)據(jù)實質(zhì)是隔離的
下圖為初步的資金無損演練方案:YlQ28資訊網(wǎng)——每日最新資訊28at.com
圖片YlQ28資訊網(wǎng)——每日最新資訊28at.com
三、得物業(yè)務(wù)實踐
作為支持得物業(yè)務(wù)的SRE主導(dǎo)了得物履約資金安全保障工作,由于得物履約的業(yè)務(wù)鏈路長,風(fēng)險敞口大,我們認(rèn)真考慮了業(yè)務(wù)穩(wěn)定性及其資損風(fēng)險并實踐了前述的相關(guān)資損防控理念。YlQ28資訊網(wǎng)——每日最新資訊28at.com
圖片YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
1.高保鏈路梳理
YlQ28資訊網(wǎng)——每日最新資訊28at.com
出價、下單、支付、發(fā)貨、結(jié)算、營銷、逆向7個業(yè)務(wù)域定義出高保業(yè)務(wù)鏈路,輸出資損點、變更點、新增表及字段以及相關(guān)監(jiān)控點。YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
2.工具選型
YlQ28資訊網(wǎng)——每日最新資訊28at.com
依托現(xiàn)有工具平臺進(jìn)行布防,成本最優(yōu)解。YlQ28資訊網(wǎng)——每日最新資訊28at.com
圖片YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
3.規(guī)則布防
YlQ28資訊網(wǎng)——每日最新資訊28at.com
資損防控通過核對規(guī)則落地,同時業(yè)務(wù)監(jiān)控配置告警規(guī)則,通過混沌工程演練驗證規(guī)則有效性。YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
4.觀測告警
YlQ28資訊網(wǎng)——每日最新資訊28at.com
a. 應(yīng)急響應(yīng)YlQ28資訊網(wǎng)——每日最新資訊28at.com
b. 自動巡檢YlQ28資訊網(wǎng)——每日最新資訊28at.com
i. 每天自動巡檢重要指標(biāo)推送到對應(yīng)的工作群YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
5.演練
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
a. 對相關(guān)規(guī)則進(jìn)行保鮮YlQ28資訊網(wǎng)——每日最新資訊28at.com
b. 未暴露風(fēng)險挖掘YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
6.實時核對體系建設(shè)
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
YlQ28資訊網(wǎng)——每日最新資訊28at.com
a. 業(yè)務(wù)插樁先旁路核對,后可阻斷核對。YlQ28資訊網(wǎng)——每日最新資訊28at.com
四、總結(jié)&展望
在得物落地資損防控期間,作為SRE一直在宣導(dǎo)的理念:資損防控需要研發(fā)、測試、SRE三方相互協(xié)作,三道防線相互兜底,合并共舉達(dá)到資損防控的目標(biāo)。未來,資損防控我們重點關(guān)注以下3個方面:YlQ28資訊網(wǎng)——每日最新資訊28at.com
- 風(fēng)險分析--目前我們主要還是基于專家經(jīng)驗,后續(xù)我們將通過數(shù)據(jù)染色,血緣分析,做到自動化的風(fēng)險輸出。
- 多體系防控--完善資損防控體系建設(shè),抽象通用防控能力與可擴(kuò)展的精細(xì)化防控能力,做到核對工具體系與業(yè)務(wù)場景相適配。
- 資損演練--在大規(guī)模的業(yè)務(wù)體系之下,純靠人去做攻擊,其實是不太現(xiàn)實的,必須得靠智能化、數(shù)據(jù)化的方式去驅(qū)動。同一個故障,我們讓它在成百上千個系統(tǒng)上面去重放,這樣我們就可以非常高效地去實現(xiàn)大規(guī)模風(fēng)險的挖掘,驗證風(fēng)險防控規(guī)則的有效性以及已布防規(guī)則的保鮮。
本文鏈接:http://m.rrqrq.com/showinfo-26-6218-0.html資損防控技術(shù)體系簡介及實踐
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: DDD 與 CQRS 才是黃金組合
下一篇: 阿里云推出大規(guī)模視覺語言模型Qwen-VL 已在ModeScope開源