(原标题:全面上云宣告收官!"零售之王"迈入全面数字化新阶段,复盘"超级工程"…)
总行信息技术部牵头、超过22个总行业务部门参加、2.35亿行代码......前后耗时三年,招商银行全面上云“超级工程”宣告收官。
至此,招行的全部借记卡账户、信用卡客户、对公账户及总分行所有应用系统全部迁移至云上,全行账户结构和应用结构全面重构,完成了招行科技底盘的升级换代,成为国内系统性重要银行前7家中首家实现全面上云的银行。
“上云之后,我们基本上完成了数字化建设的新基建,接下来将迈入全面数字化的新阶段,打造‘数字招行’。”招行首席信息官江朝阳在接受券商中国记者采访时表示。
全面上云:云开两朵
招行上云,有着拥抱行业技术路线变迁,以及满足自身经营诉求的双重考量。
从技术角度看,科技发展模式已从由少数头部厂商(IOE)把控变成由全行业推动的开源模式,科技业在“云”方向蓬勃发展;从自身看,招行在打造数字化银行的过程中,对科技基础设施不断产生新的需求。
江朝阳则在宏大叙事里补足了一个上云的具体触发点:对前沿技术嗅觉灵敏的主机开发人员,纷纷寻求换岗,分配到主机开发团队的新招人员也很快离职。这是因为传统的主机平台及集中式架构已经式微,分布式系统才是确定的技术方向,科技人员们希望主动拥抱新的趋势。
在趋势及具体事件的驱动下,招行上云大幕拉起。第一阶段是从2015年-2019年,招行建立了可以承载重要应用系统的私有云平台;第二阶段是由2020年1月-2023年1月,科技体系全部迁至云上。
尽管对外积极宣传上云进程的银行不在少数,但据券商中国记者了解,目前很多银行在采用分布式架构的同时,仍保留了传统主机(集中式架构)双轨运行;同时,一些银行上云的业务范畴只囊括部分业务。
招行的“上云”,一是从物理上关停了传统集中式架构,将所有流量切至云上,实施单轨运行;二是从业务范围上,实现了全行借记卡账户、信用卡客户、对公账户以及总分行所有应用系统全部迁移至云上。
为兼顾业务连续性、算力、可标准化程度、技术成熟性、安全性,招行选择了 “云开两朵”模式:
一朵“金融交易云”(FTC)替代主机,主要承载招行借记卡、信用卡核心账务,以及零售转账、快捷支付、数字人民币等稳态业务,保障业务连续性及核心交易稳定;
一朵“原生云”(ACS)承载主机系统之外的传统开放架构上的系统,主要承载渠道类、零售信贷等业务处理类、客户经营类等敏态业务,对标头部公有云,同时在先进性和高可用性之间取得平衡。
超级工程:充分解耦
将上云比作一个“超级工程”并不为过。先后数千名人员参与项目,覆盖22个总行业务部门。江朝阳如数家珍,用了一个精确数字来形容上云工程的宏伟——2.35亿行代码。
“我们采取解耦的方式,将一个大项目变成几百个并行实施的小项目,把工程实施难度降下来。”江朝阳总结。
在江朝阳看来,业务与技术顺畅融合是招行的优势基因。上云涉及业务组织需求理清、客户衔接、知识传递、内部操作和流程变更,技术部门要配合业务部门进行从上到下的分行业务条线培训、宣导和自身制度调整。
最根本的是顶层制度的保障。江朝阳指出,全行上云得益于管理层的重视,将其作为全行级大项目。“行长办公会定期听取上云过程的报告。管理层传递的决心非常明确,就是要举全行之力把这件事情做好。在这种导向下,大家积极配合,保证了资源的投入。”
对整个项目的实施,一个细节处理不好就可能造成大事故。据了解,招行从软件开发的管理、工程的组织、测试投产的验证、数据到用户的迁移,通过项目群的方式来管理涉及主机上云的3000多名员工的工作:设置总控,并在每一个项目开发过程中按照严谨的软件工程要求来推进相关开发工作,包括写代码、测试、投产、迁移工作、灰度发布(双版本平滑发布),都做了精细的项目管理,同时辅以一系列缓释风险措施。
其中,在信用卡领域,招行设计了“跟账机制”:新科技系统开发完后,老系统还在跑。那么招行就会将老系统的交易灌到新系统里去,让新系统也跑一遍,跑完以后看账务结果是否一致。跟账结束后,招行确认处理账务的逻辑没有问题,才会用灰度方式发布。
扶上马还要再送一程。为了保证系统上云后运行稳定,招行还专门开发了重要监控系统“北斗”。“北斗”设置的初衷是:在一个云环境下,一个集群至少有近千台服务器,每个服务器又有一堆容器。当一个事故发生,往往很难搞清楚具体哪个环节出问题,这就容易引发灾难。“北斗”存在的目的,就是要让技术人员的指令在贯穿所有处理模块的时候,其痕迹都能被记录下来,以便问题产生时能够精确定位。
科技底盘:全面升级
于招行而言,上云带来的效用并不直观地体现为IT总成本的变化,单位算力成本的下降与IT成本结构的优化显然更为重要。
采访过程中,江朝阳以“挑水”和“自来水”形象比喻:“过去挑水喝,用水就很节省,一星期洗一次澡;现在有自来水,恨不得一天洗两次。用水量不见得减少,但生活质量上了一个台阶。”
以信用卡为例,江朝阳透露,信用卡核心系统从主机平台向分布式平台下移后,基础设施成本减少约60%,但系统业务负载和算力是过去的10倍。“应用更繁多,支持的功能更多”。
结构上,基础设施成本的下降也为研发投入腾挪出更大的空间。“随着算力的提升,软硬件采购成本在我们科技费用中的占比几年内下降了一半,更多资源可以投在应用研发本身。”江朝阳说。
更为重要的是,三年上云工程期间,招行同步建立了企业级的技术中台和数据中台——前者将开发过程中提炼的共性、基础能力以功能组件形式沉淀;后者对海量数据进行采集、计算、存储、加工,同时统一标准口径,形成可复用的数据资产。
“伴随着招行云的建设和投产,两大中台的成熟度也达到比较好的状态,这样就形成了招行全新升级的‘云+中台’科技架构。”江朝阳表示。基于此,“所有的业务接下来进入了平台化发展的阶段”。
具体而言:一方面,全行科技生产效率更高、更经济,可实现低代码/零代码的快速交付。招行将此比喻为造汽车,不用从一颗螺丝开始,而是组件拼接,开发效率成倍提升;另一方面,借助“云+中台”,板块、条线、部门之间的“烟囱”“竖井”进一步拆除,业务流程、客户旅程全面打通,相应带来客户体验的提升。
上云之后:数字招行
始于“云”,但不止于“上云”。摆在招行面前的阶段性重点,是从“上云”到“云上”、从On Cloud走向In Cloud的行为习惯转变。
“近期我们要加大力度,改变开发人员、技术人员过去很多的工作习惯、思维方式,更好地把云的优势发挥出来,全面释放云生产力。”江朝阳透露。
这也将支持“数字招行”建设进一步提速。“上云之后,我们基本上完成了数字化建设的新基建,在云计算、大数据和AI方面都建立了相应的能力和结构,接下来将迈入全面数字化的新阶段,打造‘数字招行’。”江朝阳指出。
据了解,一直以来,招行数字化转型建设围绕线上化、数据化、智能化、平台化和生态化五个阶段推进。江朝阳表示,线上化、数据化基本完成后,招行下一阶段科技产出将在智能化方面重点体现,“我们会在AI、大数据领域持续发力,投入更多资源来做这件事情。”
其中,涵盖财富管理、营销、风控、作业层面的“四大引擎”是最主要的智能应用投入领域。“各类智慧能力沉淀到四大引擎,为全行智能需求提供服务”。
但投入产出并不容易衡量。“智能化投入能取代多少人力很难量化,但我们希望让自己的智能化能力在行业、在应用上都保持第一梯队水平。”江朝阳说。
谈及“数字招行”的进度检视,招行相关负责人透露,围绕“五化”及相关业务板块,该行正在搭建一整套评估体系。“招行零售起步早,数字化程度要更高,未来,科技要重点投入投金和资管,更多地用软件支持业务,让业务更加自动化。”
责编:桂衍民
校对:姚远