【2023BI数据分析大赛】信用卡全周期分析报告
作品概况
本作品以银行信用卡部视角,通过拆解“信用卡生命全周期”至贷前管理:进件、客户基础画像;贷中分析:发卡促活、交易情况、账龄分析;贷后预测:分期预测、逾期管理,为银行展示信用卡各阶段的全行/分支行发展状态,及时发现运营问题。同时以数据为基础,统计学为研究方法论,为银行提供数字化,专业化的解决方案,协助银行发展好信用卡业务。
一、选手简介
1、选手介绍
团队名称:科技为账户增值
选手介绍:
沈小强,数据分析师,主要负责数据分析工作&文案编写;
吴天水,数据中台专家,主要负责对本次数据的宽表搭建&数据清洗;
陈静怡,技术支持专家,同时协助作品美化&后期制作;
袁方,业务分析师,同时协助作品的业务分析&产品制作;
2、参赛初衷
以大赛为契机制作优质的数据产品,为信用卡业进行赋能
数据分析+可视化展示,推进银行零售业务&信用卡业务的数字化转型
通过比赛实践提升BI工具的使用方法和技巧
二、作品介绍
1、业务需求背景&当前痛点
业务需求背景:
管理层需要根据全行/地区相关标的银行,对信用卡发展作出决策
不同部门业务人员需要对信用卡业务进行活动规划
银行信用卡部需要可视化大屏展示当前整体信用卡发展状况
当前痛点:
管理层:
数据时效性不足,无法第一时间获取全行汇总指标,影响决策
数据缺乏可读性,呈现往往以传统表格形式,无法体现趋势性,难以直观理解
数据可用度较低,不同部门对指标理解不同,导致同一数据口径不统一
业务层:
缺乏数据视角,难以将业务定性分析转化为数据定量分析
缺乏分析能力,难以从数据趋势中发现业务规律
缺乏整合思维,难以从信用卡全周期中发现关联性,赋能当前业务周期
数据准备
本作品数据来自某区域内多家银行机构运营数据整合,展示部分均已脱敏;
根据实际业务需求,通过中台标签体系,整理信用卡各生命周期高频指标,并作统计分析;
模型核心指标如下图:
图1:数据准备图示
数据准备阶段,提取信用卡全流程要素,搭建标准指标体系。主要工作内容分为三部分:
数据预处理:针对不同渠道的数据源,在源数据接入后,需进行数据清洗。对结构化或半结构化数据异常值进行规范化处理,始终保持数据质量。
标准指标体系构建:从海量的实际业务需求中,提取高频需求标签。分主题分场景进行标准指标体系的构建,包括从贷前获客进件、贷中用卡交易、贷后分期及风险管控等各个业务主题进行指标的规范化定义。从而保证指标的唯一性、可用性,规避因指标含义不同而存在的使用歧义,减少交叉核对问题。
通用数据分层:按照主流数据分层理念构建主题大宽表,按照主题场景设计三类数据分层:
DWD(Data Warehouse Detail):主要是Detail明细数据,如DWD_ACCT账户主题明细数据;
DWS(Data Warehouse Statistics):主要是 Statistics统计汇总数据,如DWS_ACCT账户主题汇总数据;
DWM(Data Warehouse Market):主要是Market特定主题场景数据,如电销主题表DWM_DXZT等;
通过上述的数据准备流程,提供一个标准的强大的数据底座,为后续数据分析奠定了坚实的数据支持基础。
作品解决方案分析
本次分析整体按照信用卡全流程各阶段业务运营场景展开,主要有以下三个部分:贷前分析、贷中分析及贷后分析,具体分析内容如下图所示:
3.1 贷前分析
3.1.1待解决问题
全行月进件规模、卡转化率;制定进件、促活方针;及时发现获客异常;
建立基本客户画像,确认营销群体,降本增效;
建立营销人员KPI指标考核;
3.1.2分析思路
3.1.2.1进件分析
进件分析是对于进件相关信息的采集分析及应用。它是通过对于进件渠道、进件质量以及后续转化情况的分析,为银行对获客营销行为提供建议。通过对于营销人员的推广业绩进行排名分析,判断各营销人员的KPI达标情况,提高营销积极性。
3.1.2.2 客户画像
客户画像是对全行客户群体的深入了解和描述。它是通过对客户的基础信息、风险、活跃、收益等方面的分析和整合,形成的对目标客户群体的全面和准确的描述。通过对不同客户群体进行分层划分,以便企业可以更好地理解目标客户并针对其需求和偏好制定更有效的营销策略。
3.1.3结论及建议
进件分析:
通过进件分析,营销部门可以更加全面便捷的把握既往营销成果,从营销渠道、时间安排、转化质量等方面完善营销方案。同时动态掌握所有营销人员的业绩情况,从而对远超平均值的优秀营销人员进行奖励,提高营销积极性。
客户画像:
通过了解客户画像,营销人员可以更加直观准确地把握目标客户的需求和偏好,从而有针对性地制定营销策略,包括客户价值分层、客户偏好等,让客户更容易接受和感受到产品或服务的价值。
3.2. 贷中分析
3.2.1待解决问题
核心问题:分析客户用卡习惯,对症展开活动营销,提升信用卡规模&信用卡收入;
3.2.2分析思路
信用卡收入,主要是息费,例如取现利息、分期收入、违约金、年费等,如何能够提高收入?首先是保证发卡规模,其次是活跃程度,在此基础上才有进一步探讨创收的可能。接下来就依次从以下几方面展开分析。
3.2.2.1 发卡情况
从多角度了解发卡情况,尝试寻找发卡规律,优化发卡现状。
根据每年每月各卡种的发卡量日历图,可以直观发现发卡薄弱月份及卡种,以便复盘并在往后重点关注;
根据各分行发行卡种种类及卡量桑基图,可以知晓各分行发行卡种比重,有助于针对性地开展推广活动及政策;
根据各分行以往每季度发卡量走势图,能够看出各行发卡业绩完成情况。
3.2.2.2 激活首刷
促活是信用卡营销的重头之一,主要包括促激活和促活跃。计算出发卡到激活的间隔天数、发卡到首刷的间隔天数,绘制激活首刷走势图,展示近期持卡人的开卡、首刷习惯,为何时向客户推送促激活提醒短信、策划首刷活动等,提供参考依据。
3.2.2.3 用卡转化
此处我们只关注持卡人从申请卡片到成为收入客户过程的用卡周期,参考数字运营常用的3A3R策略模型,计算进件审批、核准发卡、激活、首刷、活跃、收入共六个环节的转化率(此处转化率通过下一阶段客户量除以上一阶段客户量计算得出),针对转化率较低的环节,着重设计营销方案,突破现有瓶颈。
注:3A3R模型,主要包括用户洞察(Awareness)、用户获取(Acquisition)、用户激活(Activation)、用户留存(Retention)、获得收益(Revenue)、推荐传播(Referral)六个步骤。
3.2.2.4 交易分布
持卡人的取现行为,会直接带来取现利息收入,而消费,也可能会进一步带来分期收入,甚至过免息期后也会产生利息,因此刺激交易量、分析交易情况十分必要。
参考波士顿矩阵,我们针对消费类交易,绘制MCC类别的单笔消费金额-交易量的矩阵图,横纵轴警戒线均为均值线,MCC按大类、小类、具体MCC共三个层次支持钻取,第一象限为交易量大且单笔金额高的交易,第二象限为交易量少且单笔金额高的交易,第三象限交易量少且单笔金额低,第四象限交易量大且单笔金额低。我们认为单笔金越高的交易越值得关注,而此基础上交易量越高越好。
对消费类交易的交易金额及占比,进行帕累托分析,观察是否符合二八法则(很多情况下80%的结果由20%的变量产生),同时可以知晓谁是交易额最大的商户。
另外对息费排名前十的分行,绘制柱形图,比对主要息费占比。
3.2.2.5 RFM模型分类
RFM模型是衡量客户价值和客户创造利益能力的重要工具和手段,包括最近一次消费时间 (Recency)、消费频率 (Frequency)、消费金额 (Monetary)三个关键要素。我们抽取消费类交易,计算每个持卡人的RFM指标值,进行观察分类,识别各类客户的价值,据此制定个性化营销方案。
3.2.2.6 VINTAGE分析
VINTAGE账龄分析法以账龄(账户已开户月份)、开户日期为维度,分析信用卡全周期使用情况;其优势在于使用了控制变量法,剔除开户时长对用卡行为的影响,将相同用卡时长的客户视为一个组,分析一簇客户在开户后第几个月存在不同用卡行为的高峰,找寻大样本量下客户的用卡习惯,对用卡营销活动有着重大的参考价值。
本次VINTAGE分析将从消费实动率——反映平均用卡高峰期;户均分期、分期渗透率——反映平均分期意向高峰期两个重要的角度去解读客户用卡习惯,分别代表着用卡规模、用卡收入两个核心维度;该方法亦可分析其它重要指标,如循环户占比、有效卡/销卡占比、还款规模等,供不同银行根据实际业务情况进行选择。
3.2.3结论及建议
结论话术通过实际业务数据动态展示于各维度报告中;
银行可根据实际发展阶段、发展规模,选择性强化管理某几项维度指标;
本次贷中分析以汇总数据为主;同时,亦可对个人信用卡使用数据进行分析;这里推荐使用LightGBM、随机森林、神经网络等机器学习算法将用户通过“活跃度”:消费/账单情况、“贡献度”:带来的收入/佣金情况、“风险率”:逾期/还款情况 3个维度进行分类,从微观的角度展开精准营销类业务。考虑到数据安全性问题,将不在本报告中详细讨论;
3.3 贷后分析
3.3.1待解决问题
核心问题:全行信用卡逾期状态分析,拟定风险管控计划及催收计划,降低不良率;
全行账单/分期行为预测分析,控制资金成本;
3.3.2分析思路
3.3.2.1 分期分摊业务分析
当前已请款分期在下一个账期开始按照分期期数逐笔分摊。但对于处于正常分期分摊的各类分期,缺少未来分期分摊数据的测算因此在分期情况次日按照分期期数、分期情况日期、账单日、账期的等分期关键信息,进行未来本金及息费分摊测算。通过测算,将每期分摊信息,包括当期分摊本金、当期分摊费用、当期分期剩余本金、当期剩余费用、分期剩余期数等主要信息测算出来,为后续分体提供数据基础。
通过仪表板中选择分期请款日期及分期分摊日期,可以快速获取所选日期分期请款及指定时间区间分期分摊情况,直接展示已请款分期总本金及总费用在未来时间段的本金分摊金额及费用分摊金额,了解本金分摊回款及应收费用产出情况。
通过面积图可以清晰看到总本金及对应已分摊本金剩余情况,及总费用及对应已分摊费用剩余分摊情况。
通过分析分期期数分布热力图,可以直观的观察每种类型期数在未来分摊的情况,为分期产品计划制定提供参考。
3.3.2.2 账单分期分析
针对已做账单分期的账户进行账单影响因素分析,追踪近半年的账单及消费金额变化情况,为后续账单分期营销活动提供决策参考。
通过分析当期所有已请款账单分期数据,结合时间线性分析,可以直观发现,在近半年连续平稳账单分期的趋势下,最近一期账单金额或消费金额有明细涨幅,也可认为客户近一期账单在连续半年内有显示大额消费场景,具有账单分期潜力。
通过分析已请款账单分期账户最近一期账单及消费金额的目标增长变化率X。针对该目标变化率,分析最近歧义账单且结合最后还款日基础上,分析单个账户账单情况。
结合分析账单分期距离最后还款日或账单日天数,可为后续账单分期提醒或账单分期营销提供参考,即在哪些日期投放账单还款或营销提醒收益最大。
3.3.2.3 逾期情况分析
通过分析逾期情况,为贷后资产管理提供参考。按照逾期户数及逾期金额分析全行各类逾期资产占比,直观了解不良资产在总资产的分布情况。
按照时间序列分析逾期MOB1、MOB2、MOB3、MOB4、MOB5、MOB6+的逾期情况,可以了解当前逾期资产变化情况,为后续不良资产管理及贷后催收提供决策参考。
3.3.2.4 五级形态迁徙
采用五级形态迁徙矩阵分析年初五级形态至当前数据的变化情况,一般五级分类定义如下:
正常:贷款期间正常还本付息
关注:连续违约期数1-3次;贷款本金或利息逾期60天以内
次级:连续违约期数4-6次;贷款本金或利息逾期60-90天
可疑:连续违约期数>=7次;贷款本金或利息逾期90-180天
损失:具备(一)、(二)、(三)所列损失标准,或者贷款本金或利息逾期180天以上
迁移率(Flow Rate):观察前期逾期金额落入下一期的几率,一般缩写为(C-M1、M1-M2……M4-M5),例如M2-M3=当月进入M3的增量贷款余额/上月末M2的存量贷款余额。
结合矩形图阵分析各个五级分类的变化情况,计算各个形态的迁移率,分析不同资产优化或者恶化的变化趋势。
3.3.3结论及建议
分期分摊业务分析:
主要用于分期请款或正常分摊的分期业务,在未来时期的分期分摊情况。分析未来账户账单分期在分期本金收回及应收费用产出规模,结合当前逾期风险情况,为当前分期营销及日常业务运营提供决策参考。
如根据面积图了解未来本金及费用分摊剩余情况,如未来XX年本金分摊超规模,则结合全行不良情况及分期产品、分期期数等,考虑收紧分期业务规模。
账单分期分析:
针对满足大于目标增长变化率的账户账单,一方面在风险管控角度:可以根据此名单推送账单分期提醒,降低逾期风险。另一方面在降本增效角度:相较于其他客户,满足此要求的客户做账单分期的概率较大,因此在促账单分期活动中,可以剔除该部分账户,减少营销成本,将更多资源应用于其他账单厚度较大的潜力客户开发中。
逾期及五级形态迁徙:
通过将银行或者客群的初期五级信用风险等级与期末信用风险等级进行比较计算,度量在特定时间内从目前的信用等级迁移到其他信用等级的的概率,为风险管理人员提供精细化分析手段和预测手段,实现对贷后资产的微观度量和有效监控。
可视化报告
4.1作品制作思路
4.1.1在正式进入FINEBI开发之前,先按照“脑图——线框图——正式开发(FINEBI)”,提高开发效率。
4.1.2先将所有的模板内容按照我们的脑图把所有模块全部内容做出来,做一个简单的分类和排版。然后沟通确定好结论内容和图表样式。
4.1.3再从头进行我们的美化工作,这样可以有效的避免,在做美化的时候出现,之前的模板出现需要添加内容添加和修改,影响到后面已经修改好的模板增加工作量。
4.2作品的图表设计思路
4.2.1 折线图
折线图在处理卡记录、激活记录和交易记录等历史数据时非常有用。它能够直观、清晰地展示数据的趋势和变化情况,比较不同时间段的数据,并突出异常值。通过折线图,我们可以观察到数据的波动、趋势和周期性,以及预测未来的发展趋势,为业务决策提供有力支持。
如图一:
图二:
4.2.2 饼图&柱状图
饼图和柱状图在处理如客户信息等多个维度的信息数据时能够充分利用其特点,帮助读者直观地理解数据的比例关系、差异和趋势。通过突出重点、比较不同类别或维度的数据,它们能够帮助读者快速发现数据中的关键信息,并支持数据分析和决策。
如图一:
图二:
图三:
4.2.3矩阵图
矩阵图可以帮助客户分类迁徙等包含大量变量的数据,通过对变量之间的关系进行编码和展示,更清晰地了解不同分类之间的变化和趋势。帮助企业或组织更好地理解客户群体的变化,从而调整营销策略、个性化服务或其他业务决策,以满足不同客户群体的需求。
如图一:
图二:
4.2.4箱型图
在客户数据分析中,箱型图可以用于进行vintage分析等其他分析,即根据客户分类的时间段,观察不同时间段内客户的表现和变化,又可以比较不同时间段内客户群体的指标分布情况,发现潜在的变化和趋势,进而调整营销策略或采取相应措施以提高客户满意度和业务效益。
如图一:
4.2.5雷达图
产品类数据通常涉及多个指标或属性,通过连接对应的点形成多边形的雷达图,可以直观地比较不同变量之间的大小和关系,直观地比较不同产品在各个维度上的表现,比较不同产品之间的差异和优劣势。
如图一:
4.2.6漏斗图
银行信用卡申请到激活的人员流失情况,非常适用于漏斗图展示数据在不同阶段或类别之间的递减关系。通过漏斗图,可以清晰地呈现数据在各个环节的减少情况,帮助观察者理解数据的流动和转化过程,以及识别可能存在的用户流失环节。
如图一:
4.2.7散点图
通过散点图,我们可以观察不同消费类别中交易量和单笔消费金额的分布情况,从而了解不同类别的消费行为。通过观察散点图中的数据点聚集情况和趋势,可以帮助我们了解客户行为,优化营销策略,并做出相应的业务决策。
如图一:
图二:
4.3图表排版布局
配色设置:以浅色系为主色调。因为浅色背景通常可以提供更好的可读性,更具专业性,浅色背景使得文本和图像更容易编辑和修改。
图表设置:图表的背景网格线都去掉了,可以使整个模块有整体性。
文字设置:突出的重点用彩色的文字表示,通过分析得出的结果用红色文字表示。
布局设置:以折现图、饼状图作为主要元素。
文本说明:通过文本框展示“分析思路”“结论建议”,会根据从那张图得出结论靠近,便于理解和美观。
4.4最终结果呈现的页面布局
图片版:
信用卡全周期分析报告.pdf (1.79 M)
三、参赛总结
1、FineBI工具
帆软BI工具拥有优秀的帮助文档及讨论社区,同时有专业的老师在线上实时答疑。这两点极大的降低了BI相对复杂的上手门槛。仪表板功能较全面,对工程师和业务人员均较为友好。
BI以一年一大版本,多个小版本的速度进行迭代,功能完善较为迅速,服务质量很高。
建议新增常用python模型包,包含无监督类(KNN\K-MEANS)、监督类(随机森林\LightGBM),协助数据工程师更好的运用BI去建模分析数据,而无需动用第三方平台。
期待后续版本接入ChatAI等功能,进一步降低使用门槛,做到全民皆是分析师。
2、参赛感悟
本次比赛我们团队在制作仪表板时尽可能的尝试了BI提供的所有图表类型,分析了每个图表适应的数据类型,并做出选择修改,受益匪浅。作为数据工程师,如何抓住数据的痛点,发现规律,是基本技能。而随着时代的发展、企业的数字化转型,如何将数据的逻辑清晰明了的呈现给“外行人”,变得越来越重要。FineBI工具就提供了这一个交互平台,一个能让数据人讲好“数据的故事”的平台。在此产品定位下,期待FineBI能新增更多的数据表达方式、新增数据分析方法、优化界面操作方式,让数据更易得、更好用、更专业,赋能各个行业。
——————————————————最新活动————————————————————
1、本篇作品将于11月19日在上海Fine Workshop活动上现场分享,活动报名:
数据分析最佳实践(银行金融专场)上海Fine Workshop 第四期来袭!
2、线下活动设有研讨环节,建议参与现场活动的同学提前阅读本文,在本帖留言评论你想和作者交流的问题,交流话题不限于:
行业场景价值/行业经验分享......
数据分析价值/数据分析应用......
数据分析思路/技能/工具/职场......
数据文化氛围/团队协同配合......
......
3、留言评论,并参与现场研讨,即可有机会参与抽奖:
(1)留言评论请以 以下格式开头:11月19日上海Fine Workshop研讨交流,......
(2)抽奖奖品:
京东卡100元*10张
《三百六十行 行行FineBI:数据分析案例集》*10本
奖品丰富,欢迎留言评论,希望大家有所收获