中國工商銀行云原生2.0建設項目
隨著工行業務迅猛增長,業務逐步向互聯網線上遷移,核心業務日均交易量近5億筆,并保持20%以上的年均增速。工行金融云作為工行數字化轉型的核心基礎設施,服務全行生產系統及外部金融生態合作伙伴,面臨著業務高速發展、架構轉型迫在眉睫、云原生服務需求旺盛、運維支撐能力亟需補齊等一系列挑戰。為此,工行基于主流開源技術自主研發了云原生2.0云計算平臺,并具備資源池化、高可靠、云生態全面、支持業務彈性擴縮等特性。基于該平臺,工行實現了銀行核心業務系統的云化部署,承載應用節點規模超15.9萬,容器數量超30萬,支持超20萬TPS的高并發場景,日均服務調用量超200億,上云業務規模同業最大,快捷支付、聚合支付、大零售、互聯網金融等業務線的核心銀行系統入云比例達 100%。同時,借助云原生2.0云計算平臺的技術能力,工行打造了為企業提供一站式Saas采購、運營及管理服務的金融生態云,累計推廣B/G端客戶16萬戶,C端客戶2700萬。工行金融云具備”一云多芯”技術架構、全分布式高可用容災體系及自主研發的云原生技術平臺等10大創新科技,得到了業界的廣泛認可,曾獲人行銀行科技發展獎一等獎,蟬聯亞洲銀行家最佳云計算國際獎項。
業務模式
工行基于研發、測試、生產(細分為總行應用、分行特色和合作方生態建設)場景不同用戶的業務和安全需求,規劃建設了五朵云,即研發云、測試云、總行生產云、金融生態云和分行生產云。
在總行生產云方面,工行金融云部署規模超2.8萬物理服務器,入云節點規模超15.9萬,入云規模和占比持續同業領先,涵蓋395個工行應用,全面承載工行核心系統運行。
在金融生態云方面,基于工行金融云的能力支撐,工行聯合企業合作伙伴,構建了面向各行業和各領域的Saas云平臺品牌,推出20余款Saas產品,覆蓋教育、醫療、政務、住建、交通、金融以及企業管理等各類行業場景,累計推廣B/G端客戶16萬戶,C端客戶2700萬。
在分行生產云方面,面向工行的境內外分行、綜合化子公司提供各類云環境和云服務,以及配套支撐,現已涵蓋44家分支機構,入云分行特色應用700多個。
技術架構
工行金融云建設了覆蓋laaS、PaaS、Saas的全棧式云服務體系,包括大規模的兩地三中心金融級云基礎架構。laaS層具備計算、存儲、網絡及云調度等基礎設施能力;PaaS層具備容器、數據庫、中間件、分布式服務等服務能力,以及日志、監控、診斷、投產驗證、 Alops、DevOps流水線等配套能力;基于laaS和PaaS平臺部署我行金融生態云Saas產品服務。
工行金融云的主要技術特點如下:
一是具備秒級彈性伸縮能力,分鐘級基礎資源供應能力,針對典型應用提供基于業務監控的自動化彈性伸縮支持,從容應對業務突發高峰場景,自動彈性伸縮超1000次/月,有效支撐雙11搶購,紀念幣預約等超20萬TPS秒殺場景。
二是具備柔性化的資源供給能力,容器化部署應用、數據庫、中間件等任何負載,構建云上資源按“實際運行情況“自動分配能力,充分利用云平臺資源集約的優勢,通過資源回環處理、全局資源配給優化、規模化應用彈性伸縮能力、落地函數計算場景等手段,實現整體等效節省1.4萬臺虛擬機資源。
三是具備全流程敏捷交付機制,通過云平臺靈活、自動化的運維流程,建立工行特色的 DevOps流程,有效賃穿從開發到生產的各個環節,提供從開發到生產的快速交付能力,打造了高效的研發環境,實現分鐘級部署,縮短產品上線周期,滿足業務功能快速上線的需要。
四是實現多元化CPU架構的容器、云主機等多種算力的集中統一管理調度,具有體系完備、自主研發、規模化的多元化芯片適配能力,構建同業規模最大的"一云多芯“平臺,支撐1萬余臺異構服務器運行。
五是具備全棧化的自主可控能力,以自主研發為主,全棧兼容架構開放的軟硬件供應商。在laaS層基于openstack技術路線的云產品構建平臺和外圍生態,其中云管平臺完全自主研發;在PaaS層通過引入Docker、Kubernetes、MySQL、red is、kafka自主研發企業級應用平臺云及泛PaaS服務;在硬件層面支持多元化芯片生態,包括arm、x86等多種芯片架構,并具備與業務應用聯動的能力。
六是打造了金融級云基礎設施,定制實現了容器調度框架及多集群機制,支持超萬級容器集群規模運行和調度;建成測試和災備動態復用的災備云資源池,解決核心系統下主機單軌運行的瓶頸問題;打造單元化的云基礎設施,實現穩定高效的單元化運行底座。
七是形成總分高效協同機制,同業首家建成資源分散、管控統一的分布式分行云,按照中心站點、區域站點兩級設計,為分行提供物理分散部署、技術能力統一、運維管理一體化的分布式”集團公有云”。
八是建立了全場景容器支撐,同業首家實現GoldenDB國產數據庫容器化,資源利用率提升8倍;同業首家實現MySQL容器化部署,首創自研不停機縱向伸縮能力,資源利用率提升4倍;建立全場景容器支撐體系,支持國產化數據庫、中間件等主流組件容器化部署, MySQL容器數據庫達7.6萬。
九是搭建了領先同業的云原生可觀測體系,實現指標、日志、鏈路三大可觀測支柱數據的高效利用。基于業界開源技術,結合工行特色進行二次開發,先后落地日志中心、鏈路監控、高精度指標監控等可觀測平臺,提供采集、清洗、計算和存儲的一體化服務,具備支撐 10萬級規模主機的能力,高峰期可支撐百萬級TPS數據處理,達到同業領先水平。
十是具備自動化、可視化、智能化的云運維能力,對標1-5-10故障處理標準,構建故障識別、定位和應急全流程自動化處理機制,打造涵蓋故障管理、成本管理、變更管理、服務咨詢四大類能力的AIOps智能運維體系,及時發現應用投產和運行風險超過500次/月,故障自愈超1000次/周,自動化熱遷移已超萬次,通過平臺快速定位和應急處理問題超過30萬次。
轉型成效
企業價值:工行金融云部署規模超2.8萬物理服務器,私有云為同業規模最大;入云節點規模超15.9萬,應用平臺云容器規模超34萬;建成同業領先的分布式云平臺,面向分行提供“中心+本地”兩級的資源供應及運維監控能力,實現資源集約,節省人力物力成本,實現技術組件、服務、解決方案等多層次復用;工行核心應用入云比例達100%,建成測試和災備動態復用的災備云資源池和單元化基礎設施,支撐主機業務的體系性下移,涵蓋互聯網金融、零售、對公、信貸等各業務線核心應用,包括快捷支付、積存金、賬戶外匯等重點產品;全面支撐大數據、人工智能、物聯網、區塊鏈等ABCDMIX前沿金融科技落地;同業首家完成私有云等保2.0四級測評,金融生態云及私有云測評結果均為優秀;通過信通院”分布式云基礎設施服務能力”、“IOMM一體化云平臺建設和運維運營能力成熟度”、“應用多活成熟度”和“智能化運維(AIOps)能力成熟度”等七項最高級別測評,成為金融同業唯一一家拿到多項最高級別認證的銀行機構。該項目獲得了2019年人民銀行科技發展獎一等獎、“第五屆數字金融創新大賽"跨類別的最高獎項“全場榮耀獎",蟬聯亞洲銀行家最佳云計算國際獎項。
社會價值:基于先進的云計算技術體系和企業公信力,工行聯合企業合作伙伴,構建了面向各行業和各領域的Saas云平臺品牌,推出20余款Saas產品,覆蓋教育、醫療、政務、住建、交通、金融以及企業管理等各類行業場景,累計推廣B/G端客戶16萬戶,C端客戶2700萬,2022年發生交易約8064萬筆,涉及交易金額約36.29萬億元,成為中國工商銀行開放生態的重要一環,極大提升了”獲客、活客、黏客“能力。
本文章選自中國上市公司協會發布的《中國上市公司數字化轉型典型案例》