随着公司数字化转型工作持续推进,技术与业务的融合度不断加强,在给用户带来便利的同时,也对生产环境的安全稳定性提出了更高的要求。海通证券数据中心做为生产安全稳定的最后防线,正面临全新的挑战。
证券行业安全生产保障面临的主要问题
01 生产环境复杂度显著提高,安全保障难度增大
近年来,随着SDN、云计算、微服务等新技术的投产使用,生产服务之间的协同、依赖关系显著增加,单个系统运维人员难以掌握全局情况,生产安全保障难度显著增大。
02 版本迭代速度快,变更频繁,风险提升
为满足快速变化的业务需求,业务系统版本的快速迭代已成为新的常态,而变更过程中由于程序质量、人工操作、参数配置等多种复杂因素造成的服务异常将直接影响到业务的正常开展。同时,由于证券行业的业务特点,能够进行变更的时间窗口十分有限,时间紧任务重,变更风险激增。
03 业务关联性多,验证难度较高
由于证券行业的特点,业务种类繁多、业务规则各不相同,除券商本身信息系统以外,还依赖于交易所、银行、结算公司等多个行业机构,传统的单系统验证方式难以完全覆盖到整个业务链路。同时,由于各系统间复杂的调用关系和频繁的版本迭代,导致验证难度较高,验证成本高昂。
目前主要解决方案
01 传统的解决方案
为应对挑战,传统的埋点监控方式,能较精确的知道系统故障点,但需要应用系统集成采集代码或专用SDK,一是侵入性较强,二是需要定制开发,三是安全性不好,四是监控点的变更复杂,需更新系统版本,实施周期较长、管理成本高昂,不适用于大范围的覆盖。
从运维到运营,以用户真实视角,主动提升运维服务能力。
02 真实用户智能感知方案
真实用户智能感知方案通过自动化手段,依托智能图像识别等技术,使用相似度计算和灰度计算等算法,从真实的用户视角出发,对行情、交易、资讯、账户等核心业务进行连续不断的无感探测,实现对系统全链路、全业务场景的可用性、健壮性感知探测,具有无需插码、不用定制开发、安全程度高,变更监控点容易的特点。
落地成果显著,有效发现、减少和规避各类生产事件。
真实用户智能感知实现效果
01 系统强化点
全链路监控,端到端一次性摸排:实现7*24小时不间断的对系统进行各种感知操作,对操作过程中各种用户可感知的信息进行验证,当发现用户感知信息有异常时,立即产生告警,并在告警详情中以视频方式向运维人员展示感知异常发生时的错误提示、操作路径、交易站点和网络测速等信息,便于运维人员及时掌握全局信息,快速定位潜在故障,恢复告警。
安全可靠,系统入侵性低:以真实用户身份对系统各项功能进行全面探测,所有的操作都与真实用户操作无异,不会对系统产生额外的影响,无需埋点、对系统无感、安全可靠、监控点变更方便快捷。
智能高效,业务覆盖能力优秀:利用自动控制和智能图像识别技术,抓取第三方实时行情数据实现行情数据实时核对,通过提取不同时段的行情曲线,进行相似度比较,自动校验标的行情曲线是否正确,并使用界面灰度算法识别应用中异常弹窗,实现业务弹窗智能关闭功能。同时,系统依托UI自动化技术,通过一次用例编写可重复使用,在开盘前可快速完成巡检,做好开市准备,做到心中有底。
02 整体效果
系统自2021年10月上线以来,已覆盖海通证券34套系统,实现A股、港股、北交所、科创版、两融等超101项业务功能的感知验证,其中交易功能61项,非交易功能约40项,交易功能中银证转账功能存管银行超20家,实现存管银行全覆盖,用户感知系统共实现验证用例合计超620条,实现验证点超2200个,主动发现安全隐患超200次,其中,行情、交易类30余次,首次发现告警约40次,提高了系统全链路和全业务场景监控强度,有效提升故障排查和解决的效率,较好的保障了用户的体验。
此外,由于用户感知覆盖系统广,可以很好的配合生产业务验证,目前已固定在周末对交易系统进行专项验证,确保周末测试、发版后系统主要交易功能的正常运行。真实用户智能感知系统作为现有监控体系的一个有效补充,能有效的发现各类潜在故障,减少客户投诉,提升客户体验,进而提升公司的品牌形象。
经过近1年的平稳运行,真实用智能用户感知系统已成为海通证券日常生产运维中的重要监控手段,在助力生产运维,提高运维能效,保障用户体验上发挥着越来越重要的作用,展望未来将在积累大量用户体验数据基础上,为海通证券生产运维提供可靠而精准的决策依据,从而为保障业务和提升公司品牌形象发挥更加重要的作用。
(来源:新视线)