随着数字经济的蓬勃发展,数据已经成为重要生产要素,成为国家基础性战略资源。数据是公司战略资产和核心经营要素之一,已经成为国泰君安内部共识。在此背景下,如何做好数据治理与应用工作,充分发挥数据要素价值,成为国泰君安高度重视的主题内容。
作为一种新兴的数据管理方法,目前DataOps应用和实践方兴未艾,总体上处于探索阶段,业界缺少系统的实践模板和理论框架。国泰君安前瞻布局、践行理念,在多年的发展中,逐渐走出了一条具有自身特色的DataOps应用和实践探索之路,致力成为证券行业DataOps应用和实践的先行者、引领者、推动者。
国泰君安证券股份有限公司首席信息官 俞枫
莱尼·利伯曼(Lenny Liebmann)在文章中指出,DataOps是优化数据科学和运维之间协作的最佳实践。在“DataOps”一词逐渐普及后,2018年,IT调研与咨询服务公司Gartner将DataOps纳入到数据管理技术成熟度曲线,定义其为“一种协作式数据管理实践,专注于改善整个组织中数据管理者和消费者之间数据流的通信、集成和自动化水平”。
目前国内DataOps应用和实践仍然处于探索阶段。在DataOps概念普及之际,作为证券行业的龙头企业,国泰君安亦前瞻布局,率先探索DataOps应用和实践,试图改变传统数据治理工具重管理轻应用、数据服务开发效率低等问题,着力破解行业数据治理与应用面临的共性问题,因而成为证券行业DataOps应用和实践的先行者。
2017年,国泰君安正式提出“数字化国泰君安”的战略发展规划,其核心思想是通过科技和数据将公司能力聚合起来,实现客户体验、运营流程、业务模式的再造和升级,让公司在进化中不断强大。这就要求公司IT具备统一的数据基础、全面的流程分析能力,还要与业务高度融合,引领智能化应用。
国泰君安通过对市场上的商用数据治理与服务平台研究和评估后发现,这些数据治理产品往往只是从管理目的出发而设计的,缺乏与公司数据服务开发流程和数据应用的对接整合能力。
出于解决数据服务开发、数据治理和数据应用工作相互衔接、相互促进的目的,国泰君安自主设计和开发了一套基于DataOps流程整合的数据治理与数据服务融合平台,上线了数据标准管理、元数据管理、数据模型管理、数据质量管理、数据资产管理、数据服务开发、数据产品设计、自助用数、自助报表等重要模块,采用数字化的手段取代传统文档式的数据管理模式,确保数据治理、数据服务和数据应用的高效保质开展。
国泰君安基于DataOps理念建设数据治理与数据服务融合平台,将数据治理流程、数据服务开发过程相融合,提供“数据统一、模型统一、服务统一”的一站式集成开发的数据服务流水线,在安全合规的前提下,实现业务需求的敏捷交付和业务端的高度自服务。
具体来说,该平台包括自研的数据开发WEBIDE、基于微服务架构的数据服务治理框架、基于“流量、延迟、并发、可靠性”要求的四维数据服务SQL路由及引擎等技术组件,核心组件的组合与基于DataOps的理念真正有效地将数据服务开发流程与数据治理流程无缝整合在一起,有效提升了数据的安全性,降低数据在公司内存储的副本数,提升数据服务开发效率和可靠性。
在平台建设方面。首先,将数据服务的开发流程一体化地形成流水线作业,提升规模处理能力和效率。其次,通过自研的WEBIDE实现数据服务开发实时调用数据治理数据标准、元数据、数据质量接口,将数据治理管控前置到数据服务开发流程中,有效提升了公司内数据使用的一致性与可靠性。第三,创新地将数据作为企业资产并围绕数据全生命周期集合相关管控活动、绩效和风险管理等工作,目前已录入了1376条数据标准,支持1120条数据质量规则,已出具33512条数据检查报告。最后,通过微服务架构和自主掌握的数据服务全流程开发框架,实现从数据采集到数据服务全链路的全流程一站式服务,提供知识图谱、智能推荐、智能行情推荐、经营报表、实时大屏等平台化服务,赋予用户仅通过单一平台即可实现数据传输、数据计算、数据治理、数据分享的各类复杂组合场景的能力,便于数据服务的开发能力在公司内部共享和数据口径的统一。
经过多年的落地实践,该平台在技术创新和机制创新方面颇为突出,彰显国泰君安作为证券行业DataOps应用和实践的引领者的实力和努力。
数据作为一种新型生产要素,实现价值体现在用数环节,国泰君安在融合平台基础上实现各级员工“能用数、会用数、用好数”的用数需求。
一是构建体系化数据服务套件,实现全员“能用数”。平台面向集团全员提供取数、查数、看数等各类数据服务套件,力求覆盖全员工、全用数领域,包括数据实验室、API等取数工具,数据地图、企业画像等查数工具,管理驾驶舱、智能报表等看数工具及君易报、DMP标签管理平台、数据资产管理平台、数据学堂等数据服务。
二是打造“1+N+X”数据能力培养体系,抓好骨干“会用数”。用好工具的核心是人。自2022年以来,国泰君安重点打造集产品、活动、培训等于一体的数据知识学习平台——数据学堂,通过场景化教学、综合化课程与平台化服务,提供数据应用人才培养体系,聚焦数据应用重点领域,通过“培训平台、双周有直播、数据分析师训练营”等多维度、递进式的培训体系,积极营造“学数”文化氛围,推动数据人才队伍建设,提升集团员工用数能力。
三是连接总分、母子协同链条,场景驱动“用好数”。2022年以来,国泰君安推进16个单元统一标准数据集市建设,积极构建体系化数据服务套件,致力打造“1+N+X”数据能力培养体系,为集团各单元“用好数”打下了坚实的基础。同时,通过建立集团内数据开放和共享机制,连接总分、母子协同链条,实现集团内数据流通,集团各单元通过业务场景驱动“用好数”,有效赋能经营管理。
自融合平台上线以来,深入应用在集团数字化发展的多个领域,取得了多项积极效果。
首先,平台实现集团数据资产汇聚共享、数据服务套件应用、数据治理体系运作、数据应用能力培养等四大核心能力,通过数据中台链接业务场景和信息系统,促进“有数”“治数”“用数”的集团数据生态良性循环,最大化发挥数据要素作用,赋能公司高质量发展。
其次,平台纳管超过1.2万张表的元数据,1300项数据指标,超过3.3万项数据质量核验项。上线至今已提供超过500项自助数据服务接口,日查询量超过3000万次,将数据服务开发的交付时间由天级别提升至分钟级,通过以应用促治理的创新方式,有效提升集团数据资产的使用效率。
第三,平台有效降低了企业内部数据存储的副本数,以及公司数据存储冗余,可每年为公司节省400万元的存储成本。平台采用自主研发方式,部分组件采用开源组件,数据库组件支持自主可控分布式数据库及主流国内、国际商用数据库,不特定依赖国外软硬件,具有很高的自主可控程度。
截至2023年6月末,集团层面数据用户突破7300人;数据产品渗透率超过60%,集团层面数据用户呈现加速增长态势。
作为一种新兴的数据管理方法,Gartner预测,到2025年,以DataOps实践和工具为指导的数据工程团队的工作效率,将比不使用DataOps的团队高10倍。未来,国泰君安将继续践行“业务数字化、数字业务化”发展理念,深入推进全面数字化转型,打造“SMART投行”,持续探索DataOps应用和实践,在赋能公司数字化转型和高质量发展的同时,致力成为证券行业DataOps应用和实践的推动者,为数据治理、数据开发、数据服务融合实践贡献国泰君安的智慧和力量。