【2024中国数据生产力大赛】BI助力信用卡业务数字化转型
BI助力信用卡业务数字化转型
一、企业简介
银联数据服务有限公司,作为中国银联的全资子公司,自2003年在上海成立以来,一直致力于成为金融科技领域的领导者。我们以创新驱动为核心,为全球200多家金融机构提供全面的账户服务和管理解决方案。我们的服务范围覆盖银行卡发卡核心系统、增值产品、咨询与数据分析服务,为数亿张卡片提供安全、稳定、高效的运营支持。
秉承"科技为金融赋能"的企业使命,银联数据服务有限公司不断推动数字化服务的升级,构建开放型生态系统,以技术引领产品创新,以专业赋能行业发展。我们的团队由一群充满激情和创造力的专业人士组成,他们对金融行业的深刻理解和对技术的不懈追求,使我们能够不断为客户提供卓越的服务和解决方案。
截至2023年底,银联数据拥有各类客户500余家、国内信用卡数据处理外包市场份额超过80%,系统运营信用卡总卡量3.7亿张,其中有效卡量超过2亿张,日均交易量超过5.9亿笔,日均交易额560亿元。
图1. 发展历程
二、数字化转型之旅
在数字化浪潮的推动下,银联数据服务有限公司正站在金融科技创新的前沿。目前已为上百家客户银行提供定制化的数据支持服务。同时,也让我们意识到了数据整合与分析在业务发展中的核心作用。
随着业务的不断扩展,我们面临着数据分散和数据平台不一致的挑战。客户银行的数据消费者经常需要在多个平台之间切换,以校对数据口径和对接数据,这一过程不仅繁琐而且效率低下。为了提升客户满意度并应对这一挑战,我们认识到必须构建一个统一且高效的数据展示平台,这不仅是技术上的突破,也是服务模式的革新。
此外,内部业务的高效整理和展示同样重要。我们希望通过BI工具,为业务部门和科技部门提供直观的报表和监控大屏,使领导层能够迅速把握公司业务的全局,并做出明智的决策。科技部门也需要实时监控系统作业的状态,以便快速响应和解决问题。
在这一背景下,我们提出了一个宏伟的目标:不仅满足于复杂报表、大屏的开发,更要深入挖掘数据资源,建立符合业务需求的模型,并通过数据挖掘揭示数据背后的深层含义。将BI与数据分析相结合,进一步为业务赋能,这成为了我们新的挑战和发展方向。
图2. 信息化建设历程
三、项目解决方案
1、数据总线平台建设:统一指标体系
在数字化转型的浪潮中,银联数据服务有限公司面临着数据孤岛和烟囱式架构的挑战。不同部门间的数据标准不一致,导致业务分析和决策支持效率低下。为了解决这些问题,公司决定构建一个统一的数据总线平台,以实现数据的高效整合和标准化管理。
【实施策略】
数据治理团队组建:成立由技术部门领导负责的数据治理团队,负责从数据源接入到数据消费的全流程管理。
业务需求分析:深入分析信用卡生命周期的各个阶段,明确业务需求,输出符合需求的数据指标体系。
数据标准和规范制定:基于业务需求,构建统一的数据标准和规范,形成清晰的数据管理蓝图。
【关键成果】
统一指标体系:建立一套覆盖进件、客户、账户、卡片、交易、分期、风险、收入等主题的标准指标体系。
数据字典创建:为每个指标提供准确释义,实现指标逻辑口径的统一。
数据仓库构建:基于统一标准和规范,构建强大的数据仓库,支撑数据分析和决策。
数据集市搭建:依托标准化的数仓,搭建了客户主题、账户主题、卡片主题、交易主题、分期主题、收入主题、风险主题等多业务域的主题集市。
图3.1 信用卡总线平台指标体系
随着数据总线平台的建设和完善,银联数据服务有限公司将能够更有效地管理和利用数据资产,为公司的持续发展和市场竞争力提供坚实的数据支撑。
【数据规范】
指标口径统一:口径问题永远是报表校验中的最大痛点。从同一个银行对同一个字段在不同报表中的口径问题,到不同银行对同一个字段的口径问题,再到同一个公司不同部门之间对同一个字段统计的口径问题,这些口径的校验以及解释目前占用了数据工程师相当多的开发时间。如何整合常用口径,统一定义新口径,形成数据工作的标准流程与规范,完成对数据信息项的全面梳理,将是解决口径难题的关键。
数据流重构:按照日常数据需求处理流程,重新梳理整个数据流向。从需求提出至需求池通用指标评估再到各个主题宽表的跑批顺序,最终下游文件的自动化下发,均按照实际数据流向重新设计,整体跑批效率提升10%。
图3.2 平台作业数据流
【数据迭代】
持续性指标体系迭代:随着业务发展,下游系统新增数据需求会反哺至指标体系,新增完善业务指标,保障指标体系持续可用性。
如:针对反洗钱业务场景,新增疑似欺诈、疑似套现、交易对手等指标;针对长期睡眠户监管要求,新增长期睡眠、清户标识等指标,满足行内快速实施清户降低长期睡眠数据等。
需求池指标挖掘:针对日常开发需求场景,每季度组织需求评估小组人员评估当年需求池中通用需求情况,提炼业务需求中新的通用指标。待充分评估后提交开发,添加至通用指标体系中。
图3.3 需求处理工作流
2、数字化分析平台搭建:释放数据价值
在完成数据治理的基础上,结合数据总线平台搭建一站式BI数字化分析平台。实现了数据源接入、数据采集、数据处理到数据分析和挖掘等全流程通道,形成了一个从数据到决策的闭环。为信用卡业务的数据决策分析提供了完整解决方案。
图3.4 数字化分析平台架构图
结合BI强大的数据分析及可视化功能,可以有效提升信用卡业务数据分析及业务决策能力。例如,我们可以从用户的消费习惯、用卡记录等数据出发,对用户的还款能力、逾期风险等进行预测和评估。同时,通过对用户的消费行为、用卡记录等数据进行深度分析,可以进一步了解用户的需求和偏好,从而提供更个性化的服务。
图3.5 数据服务体系
基于数字化分析平台,进一步提供高效的数据支持服务。首先大大提升了日常报表开发效率,减少代码开发冗余;其次口径的统一确保报表间交叉核对异常问题减少;最后通过BI制作标准的主题模板实现不同模块的灵活复用,提升决策效率。
四、典型案例
1、数据治理——促进内部管理提升
痛点:
(1)日常报表开发及运维信息相对分散,比如当前系统每日交付多少报表数量?给不同监管部门报送哪些报表?诸如上述问题的回答都是不够清晰的,对于上级需要统计数据只能临时手工查询,耗时耗力。
(2)日常系统跑批监控预警主要通过系统告警或短信通知方式,缺少可视化监控预警模块,如报错信息获取后需要手工查询报错信息,定位问题后再逐一处理,问题及时处理率有待提升。
解决方案:
1.1 搭建数字化作业运维驾驶舱
依托帆软BI平台,结合日常报表开发及运维各类场景,进行资产盘点。比如监控每日作业跑批任务完成情况,整理所有报表跑批信息,及时获取跑批情况;针对每日报送重要监管指标,通过BI预警功能制定预警计划等。
图4.1 作业运维驾驶舱
1.2 完善作业监控模块
对整个作业系统跑批流程进行逐一拆分,通过BI平台分析每个过程异常行为。从而及时发现问题,并优化处理。如分析每日下载情况趋势,对下载时间异常增加的作业进行预警,反馈到具体负责人及时排查异常情况等。
图4.2 作业运行监控预警看板
图4.3 资料库监控预警看板
1.3 指标预警监控模块
针对重要指标异常信息,建设北极星指标预警监控信息。通过设置阈值参数,对超出阈值范围的指标及时预警,及时反馈至负责人进行异常排查,确保数据交付的准确性。
图4.4 指标监控预警看板
1.4 关键文件监控模块
通过对日常交付文件的梳理,按照文件类别、客户信息等属性,搭建文件管理平台。解决文件查询不在摸不着头脑,临时手工查询等耗时耗力问题。同时,针对重要文件每日监控跑批情况,保证关键文件交付的及时性。
图4.5 文件监控预警看板
成效:通过作业运维驾驶舱可直观获取每日作业跑批情况、重要指标或文件预警情况等,提升系统运维能力。
其中系统运维比较重要的问题处理及时率较之前增加5个百分点,进一步夯实了报表准时交付的基础。
2、BI可视化服务——细化数据解释,放大数据价值
痛点:
(1)日常业务运营关键指标往往通过二维表展示或隐藏在报告中的数字中,无法直观反映业务经营变化情况;
(2)缺少全场景多维数据的联动,数据直观反馈业务趋势能力不足。如缺少站在不同的维度视角及数据切片,对不同主题及维度的数据联动,业务分析决策能力待提升;
解决方案:
基于帆软BI强大的可视化功能,以数据总线为底座,结合日常业务运营需求,搭建数视界可视化服务平台。通过业务运营、实时监控、风险视图等多维度、多方位、多视角展示银行运营情况,保证银行的高效运营,实现银行的精细化管控。
2.1 首页视图
首页视图依托帆软BI平台,对银行关键资产以及运营情况进行汇总。例如全行总发卡量、总交易额、透支本金等,并且交易和资产生息情况按分行进行展示。通过首页大屏,银行管理层可以快速了解全行以及各分行的运营情况。
图4.6 全行规模大屏
2.2 获客视图
获客视图主要展示全行获客业务情况,例如客户进件量、发卡量、有效卡量、激活率、首刷量、活跃卡量等指标。同时通过折线图、柱形图等展示主要北极星指标近一年的变化趋势。从进件到激活首刷、再到活跃睡眠等,整体反映获客质量及存量客户经营情况。如通过睡眠率趋势变化情况,发现近期睡眠率已接近监管预警线,可实施促活跃方案来及时降低睡眠率。
图4.7 获客大屏
2.3 经营视图
经营视图主要是对全行与经营主题有关的指标进行展示,例如授信额度、生息资产、总收入、资产收益率、分期渗透率等指标。同时对这些经营数据最近一年的变动可视化为图标,通过折线图、柱状图展示各项营收的变化趋势。数据大屏可以实时更新数据,展示最新的业务运行状况,这使得管理层可以快速发现潜在的问题和机会,及时调整策略,提高决策效率。
图4.8 经营大屏
2.4 风险视图
风险视图主要针对银行的不良资产,包括不良率、年化不良率、不良本金、年新增不良本金、年新增不良率五个指标进行监控。通过对历史数据的分析,可以建立预测模型,预测未来一段时间内的业务趋势和风险。当实际数据与预测结果出现较大偏差时,数据大屏可以及时发出预警信号,提醒管理层注意并采取相应措施。
图4.9 风险大屏
成效:
目前提供4大主题场景展示,涉及指标50余个,图表分析看板30余个。同时处理加工近36个月月末关键指标切片数据,用于业务趋势变化可视化分析。通过大屏快速的数据获取,有效减少的日常数据查询需求量,如BI应用较好客户近两年查询量的变化趋势,环比下降近50%。
图 4.10 需求减少情况
通过数据大屏对银行信息全面和及时展现,解决了银行日常管理中信息传递不及时的问题。作为数据可视化的重要工具,助力银行实现数字化转型,将数据作为战略资产,提升核心竞争力。
3、数据赋能业务——促进信用卡收入水平提升
痛点:
通过分析近五年商业银行发卡规模的增长数据,信用卡业务已从高速增长模式转为高质量发展模式。与此同时,2022年7月发布的信用卡新规,要求长期睡眠卡率不得超20%。如何将沉睡客户“唤醒”,甚至进一步转化为高价值客户,为银行带来收入?我们尝试用BI说话,从数据中发现机会和思路,实施精准营销,构建有温度的差异化服务。
解决方案:
结合BI平台强大的数据分析能力及丰富的信用卡业务指标体系,对信用卡业务收入数据建模分析,定位影响短板,并给出业务提升建议。
整体提升方案步骤如下图:
图4.11 信用卡业务收入提升方案
(1)信用卡业务收入由利息、年费、违约金、分期手续费、佣金等主要类型收入构成,通过数据统计可视化个业务分布情况;
(2)通过对业务收入类型的分布分析,确定哪些收入类型还存在提升空间;
(3)针对具体的收入类型,通过数据建模分析关键影响因素;
(4)分析影响短板因素,给出提升建议措施;
(5)评估建议措施可行性,落实方案实施;
(6)实施结果追踪及分析,评估建议方案的有效性;
整体方案从收入类型分析入手到影响因素分析并给出建议措施,在方案实施后给出结果追踪与反馈,行程一个完整的闭环。达到数据赋能业务,业务反哺数据的良性循环。
本案例选取A行为信用卡收入提升分析案例,A行为发卡规模在区域发展较好的城商行。但收入上较全国同业还有一定差距,结合上述方案进行如下分析:
3.1 收入类型分布分析
使用BI平台对A行的2023年前三季度主要分行的收入类型分布可视化分析如下图:
图4.12 信用卡收入类型分布情况
从图中可以看到,在某银行的分行中,利息所占比重都很高。而分期手续费不仅比重小,而且不同分行间波动较大,说明分期手续费可以作为银行分析并提升收入的关键因素。
3.2 用卡转化分析
有效卡是指卡状态正常且未过有效期可以正常使用的卡片,其规模一定程度反映了信用卡申请到激活首刷的人员流失情况,同时也为业务收入奠定了坚实的基础。
通过分析信用卡申请-激活-首刷-活跃-收入等数据,使用BI平台漏斗模型图可以直观的展示数据在不同环节或阶段之间的转化情况,识别可能存在的用户流失环节。
图4.13 信用卡收入转化情况
从图中可以发现,客户在以下三个环节有明显的减少:其中环节一,受限于审批规则及综合资质等,可以考虑从提升进件质量等方面优化;环节二和三是我们重点关注的部分:促激活,例如定期推送激活提醒短信、设计首刷返现等活动,吸引用户激活使用信用卡;转收入客户,通常考虑从提高用户粘性着手,例如额度调升、分期邀约、分期费率折扣、个性化推荐等。
3.3 分期类型分析
通过对历史分期情况的分析,挖掘分期客户的共性,如活跃度、账单厚度、消费情况等关键因素分析,为后续的分期营销提供参考。
首先使用BI平台,采用帕累托模型按照分期类型进行历史数据分析。如下图可以看出大额分期和账单分期占比超过了95%,其中大额分期占比78%。所以银行在账单分期方面还有很大的提升空间,后续就如何提升账单分期规模作为重点分析目标。
图4.14 历史分期类型情况
3.4 账单厚度分析
对于存量账单分期客户的分析,首先我们通过分析每期最后还款日已做账单分期的近6个月的账单总额变化情况:
图4.15 历史账单金额变化
基于对过去六个月账单分期情况的综合分析,显露出连续稳定的账单分期趋势,而在最近一期账单中则突显出明显的支出增长。这种变化暗示着客户在最近账单中出现大额消费,因而存在着账单分期的潜力。进一步分析过去半年每期消费总额的变化,呈现出与账单金额变化趋势相似的模式,二者呈现出显著的相关性。这表明客户的消费行为直接关联着账单金额的波动,而这种行为变化可能会影响客户对账单分期的选择。综合分析账单分期与最后还款日之间的天数,为后续账单分期提醒或营销提供了参考依据。
图4.16 分期日期分布
综合分析账单分期与最后还款日之间的天数,也可以为后续账单分期提醒或营销提供了参考依据。分析显示,客户更倾向于在最后还款日前一至两天以及当天进行账单分期操作。这为银行提供了有针对性的推送时间窗口,以提高账单分期服务的使用率。
成效:
对于各关键影响因素优化方案实施过程中,可以通过BI平台对实施过程中各阶段数据进行追踪。如在提升有效卡及客户活跃度环节,通过分析激活与首刷率变化情况,跟踪实施效果是否有效。
图4.17 激活首刷占比情况
如上图案例所示,使用BI平台制作激活率与首刷率占比折线图,可以直观展示在方案实施前后有效卡及活跃量的变化情况。从而判断是在哪个环节需要进一步优化提升,哪个环节需要下一步分期转化等。
使用BI平台制作分期业务规模变化情况,直观展示在方案实施前后的环比变化情况。
图4.18 分期规模变化情况
如上图示例分析在建议方案实施之后所统计的分期业务的总量,与实施前的对比。可以看到,分期交易量虽然有所波动,但是总体来看呈现稳步上升的趋势,说明这些策略具体一定的可行性。
4、BI助力数据建模——客户精准营销
痛点:
(1)实现精准营销,定位目标客户是首要步骤,构建用户画像是核心关键。企业需要通过市场调研和数据分析,深入了解目标客户的需求、偏好以及消费行为,以便制定出针对性的营销策略。这一过程中可能会遇到的难点包括数据的收集、处理和分析的准确性,以及对目标客户群体的理解程度;这一过程的复杂性和对专业技术的要求都增加了精准营销的难度。
(2)核心模型的搭建技术性和专业性较高,对于业务人员来说往往难以理解,通过BI就可以实现模型核心指标和关键因子的直观展示,便于业务人员理解和使用。
解决方案:
以下方案引用我部为某银行刷卡金活动开发的客户价值模型
(1)应用部门内部开发建立的数据总线平台,整合不同来源的数据,快速准确收集合理有效的信息,减少后续数据整理和清洗的工作量。初步整合的特征大致可分为四类,分别为反映客户自然属性的特征,包括性别、年龄、学历等;反映客户消费水平的特征,包括客户近12个月的交易流水状况、账单金额、额度使用率等;反映客户账单清偿能力的特征,包括客户近12个账期的逾期、还款情况等;反映客户分期习惯的特征,包括客户近12个月的分期次数、分期金额等。可应用BI对这些特征初步进行一个描述性统计分析,挖掘一些可用信息。
图4.19 全行客户画像
(2)对于模型的因变量选择,由于涵盖了近一年的数据,考虑时间顺序远近的影响,使用权重来表示不同日期的影响程度;研究发现银行的收入结构符合帕累托法则,即80%的收入是由20%的高价值客户提供的。最终分类规则按加权应收收入划分为四类,其中高价值客户占比为20%,符合实际业务逻辑。经调整后,在测试集上对于高价值客户的准确率从78%提升至91%,模型整体准确率提升2.5%。
(3)应用机器学习和人工智能算法来进行进一步清洗和分析特征,在此过程中发现月度流水类特征(涵盖交易、分期等)受随机事件以及节日、活动等影响较大,数据呈现较强波动性,且不同客户的消费习惯不同带来的交易月份的错位性,使得模型较难使用。分析发现季度化、年化交易等统计特征可以很好的综合短期带来的不确定性,使其长期呈现一定的规律性,展现不同价值客户在一定时间段内的相似性,这类特征对客户价值高低预测具有更高的贡献度。
(4)机器学习算法量化的特征重要性程度(排名前10)可以通过BI来进行展示,使用柱状图可以更直观的展现出不同特征的重要程度,便于业务人员快速识别差异,按照大小进行排序也可以更好的掌握关键特征,有助于进一步的分析和优化营销策略。如图,影响该银行客户应收收入的最主要因素为利息和消费金额,说明该银行客户主要提供的应收收入为消费带来的透支利息;排名第三的是分期费用,说明该银行客户次要提供的应收收入为各类分期带来的手续费。
图4.20 特征重要性及客户价值分布
(5)通过BI绘制出的玫瑰图方便客户银行直观的了解到本行客户的价值高低情况,包括数量(每个类别的占比及总数)及质量(每个类别的划定范围,即可为银行提供的应收收入金额区间),其中高价值客户占比19%,为银行提供超70%的收入;中低价值客户占比27%,为银行提供8.7%的收入;中高价值客户占比19%,为银行提供19%的收入;而低价值用户占比34%,为银行提供的收入不到1%,几乎无法为银行带来收入。通过这个进一步表明银行的核心收入来源于高价值客户,如何维护好现有高价值客户和吸引新的高价值客户是业务核心关键。
(6)混淆矩阵是机器学习中总结分类模型预测结果的情形分析表,以矩阵形式将数据集中的记录按照真实的类别与分类模型预测的类别判断两个标准进行汇总。其中矩阵的行表示真实值,矩阵的列表示预测值。通过矩阵可以清楚的看到模型对于最高和最低价值客户的识别准确率最高,分别为92%和97%,而对于中价值客户的识别准确率有所下降,但也均超过了83%。整体来看识别准确率达90%。通过BI展示可以让技术人员直观的看到模型对于各类别客户的识别情况,方便进行针对性的分析和调整,提高模型对于实际数据的预测效果。
图4.21 模型评价指标
(7)精确率和召回率是评判模型好坏的两个重要指标,二者又在一定程度上相互冲突,无法同时达到最优,可以通过调整分类概率阈值的方式来调节。通过BI我们可以展示滑动阈值滑块对精确率和召回率的变化影响,包括增减情况和幅度大小,从而方便技术人员及业务人员根据实际业务需求来选定最终的模型分类概率阈值,经多次实验得到的最终模型的精确率和召回率均达到了90%。
成效:
依据大量数据最终搭建的客户价值模型对于客户价值的识别准确率达90%。此模型实现了精准识别客户的价值,满足银行达成梯度发放不同金额的刷卡金,促进客户活跃的目标,对于银行进一步优化营销策略有比较大的帮助。而且通过BI绘制的相关图表也为技术人员优化模型和业务人员理解模型如何发挥作用提供了便利,便于及时调整和优化活动策略,以保证活动的持续有效。
五、项目总结及展望
通过本次项目实施,一方面为用户可以进一步拓宽至其他场景的应用提供了参考。如业务获客、活跃经营、风险管控等各类信用卡业务经营场景。同时通过数据指标体系的不断迭代,进一步提升数据应用程度,推动业务人员对BI的应用程度提升,最终实现数据赋能业务,驱动业务发展的目的。
另一方面也加深了对数据与业务的理解。数据是业务的基础,业务离不开数据的支持和驱动。数据可以为业务提供决策依据、优化运营、提高效率和增加收益等。总之,数据和业务是相辅相成、互相促进的关系。只有在数据和业务紧密结合的基础上,企业才能获得更大的成功和发展。
随着时代的发展、企业的数字化转型,如何将数据的逻辑清晰明了的呈现给“外行人”,变得越来越重要。帆软的工具就提供了这一个交互平台,一个能让数据人讲好“数据的故事”的平台。在此定位下,期待FineBI能新增更多的数据表达方式、新增数据分析方法、优化界面操作方式,让数据更易得、更好用、更专业,赋能各个行业。