【帆软杯】银行信用卡可视化分析

楼主
我是社区第886286位番薯,欢迎点我头像关注我哦~
12

 

1.团队介绍

本队队名为“奇迹”,队长杨静怡,队员张郭琳、林瑞滢,指导老师龚志伟。因大家都喜欢数据分析和数据可视化,且都有一定的基础,于是我们聚到了一起,组成团队参加本次比赛,希望能在过程中学习到更多的知识,挖掘数据背后隐藏的信息,做出更好看、更清晰的图表。团队中每个人都参与了各项分工,包括数据抓取、数据清洗、数据分析、图表建立、文档编辑等。

2.作品背景

信用卡作为一种全新的支付手段和信用工具,是中国个人金融服务市场中成长最快的产品线之一,能够给银行带来巨大的利润。目前,我国信用卡透支贷款的年利率在18%左右,同时还有相当可观的分期付款手续费收入和商户回佣等中间业务收人。根据各上市银行2015年年报公开媒体的数据统计,截至2015年年末,全国信用卡累计发卡4.32亿张,授信总额为7.08万亿元,银行信用卡业务总收入为649.03亿元,同比增长38.11%

信用卡业务给银行带来高收益的同时,也伴随着高风险。截至2015年末,我国信用卡业务逾期半年未偿信贷总额为380.27亿元,较2014年增加22. 63亿元,增长率为6. 33%。我国的信用卡平均不良率已经达到2.07%,为近年来新高。

我国的信用卡业务较国外起步晚,与国外成熟的信用卡市场相比其规模还很小,相关的制度还不够完善。作为纯信用模式下的金融信贷产品,信用卡风险主要包括三个方面:信用风险、欺诈风险、操作风险。近年来,随着互联网金融的快速发展以及支付模式日益多元化,信用卡违约现象逐渐增多,不良贷款快速增长信用卡欺诈、违法套现等违法犯罪活动不断出现,并呈现出新趋势新特点。信用卡欺诈不仅给银行造成经济损失,还会带来巨大的声誉风险,降低客户对银行的信任度。基于此,各银行加强信用卡管理,提升风险防控能力已经刻不容缓。

本团队获取某银行的客户信用卡记录,挖掘数据的潜在价值,为该银行的信用卡业务决策提供参考。该银行面临的信用卡欺诈和拖欠现象比较严重,发生比例高于我国银行行业的平均值,本团队希望通过对影响客户信用等级的主要因素进行分析,以及结合信用卡客户的人口特征属性对欺诈行为和拖欠行为的影响因素进行分析。

期望通过对银行的客户信用记录、申请客户信息、拖欠历史记录、消费历史记录等数据进行分析,将不同信用程度的客户进行归类,研究信用卡贷款拖欠、信用卡欺诈等问题与客户的个人信息、信用卡使用信息的关系,为银行提前识别、防控信用卡业务风险提供参考,从而减少银行在信用卡业务方面的损失。

3.制作流程

(1)数据来源

从某银行抓取了9982条经过脱敏处理的客户信息数据,包含客户号、客户姓名、证件号码、年龄、性别、婚姻状态、教育程度、职业类别、户籍、居住类型、车辆情况、保险缴纳、工作年限、个人年收入、信贷情况、信用总评分、信用等级、额度、审批结果、拖欠标识、拖欠总金额、逾期天数、币种代码、日均消费金额、日均次数、单笔消费最小金额、单笔消费最大金额、是否存在欺诈。

利用SPSS Modeler软件对数据进行清理和删掉离群值,经过本团队的多次检查和处理,最终将剩余数据分成了四个原始表。

(2)框架

(3)设计思路

根据本案例获得的银行卡信用卡记录的数据,挖掘数据的潜在价值,为该银行的信用卡业务决策提供参考。

第一部分,对银行卡的申请进行分析,主要分析银行卡申请成功的影响因素,对申请新信用卡的客户进行评分,以此控制客户信用卡风险;

第二部分,分析客户信用等级的影响因素,根据客户的重要性高的指标进行信用评分,指定不同的信用等级,并对关联性突出的因素进行进一步分析;

第三部分,对客户拖欠行为进行分析,先根据其客户属性进行统计分析,对存在拖欠行为的客户进行一个全局的统计分析,然后分析拖欠程度的影响因素;

第四部分,对客户欺诈行为进行分析,先根据其客户属性进行统计分析,对存在欺诈行为的客户进行一个全局的统计分析,然后分析欺诈的影响因素;

第五部分,对客户进行风险价值的分类,通过聚类分析将客户分为九类,根据不同类别的客户,为银行的信用卡业务管理提供参考。

 

4.成果展示

通过对银行的客户信用记录、申请客户信息、拖欠历史记录、消费历史记录等数据进行分析,对不同信信用程度的客户进行归类,研究信用卡贷款拖欠、信用卡欺诈等问题与客户的个人信息、信用卡使用信息的关系,为银行提前识别、防控信用卡业务风险提供参考,从而减少银行在信用卡业务方面的损失。

4.1 模块一


本模块分析了影响客户申请银行卡是否成功的重要因素,可以看到个人年收入的影响远高于其他因素,并将年收入在8万进行划分,例如,年收入大于8万且没有拖欠历史的客户申请信用卡一定成功。

4.2 模块二


本模块分析了影响客户信用等级的重要因素,可以看到个人年收入对客户的信用等级判定是最重要的,信用等级越高,客户年收入普遍越高;且客户的信用等级将随着消费行为的变化而不断调整,信用等级越高,客户日均消费金额普遍越高。

4.3 模块三


本模块分析了拖欠客户的特征和影响客户拖欠程度的影响因素,得到拖欠客户的主要特征:男性、未婚、租房、个人年收入低等,以此为银行评估客户发生拖欠行为的可能性,通过减少用户借贷额度等方法来降低银行的损失。

4.4 模块四


本模块分析了欺诈客户特征和影响客户产生欺诈行为的影响因素,得到欺诈客户的特征:个人年收入低、生活和工作不稳定、受教育水平低、刷卡频率高等,应降低具有这些特征客户的信用等级和额度,防范客户欺诈行为。

4.5 模块五


本模块按照客户的价值和客户的风险对客户进行分类,根据客户的日均消费金额、日均刷卡次数可以划分客户给银行带来的价值,根据客户的信用评分、是否欺诈、拖欠得分可以衡量客户存在和潜在的风险,将客户分为了九类,以此对不同类别的客户采取不同的营销措施,增加银行的盈利,并降低银行的风险。

5.总结与分享

银行在信用卡申请的审批过程中,需要区分某些潜在价值低且信用风险高的客户,拒绝某些指标达不到的申请。对潜在价值高且信用风险低的客户,给予大的信用额度;而对潜在价值低且信用风险高的客户,给予小的信用额度。在判断客户是否存在欺诈行为时,可以从客户的消费记录着手,关注客户的刷卡频率,并且对客户“单笔消费是否透支”以及“日均消费是否超过收入”进行记录,从而及早发现可能有欺诈行为发生,对于很有可能产生欺诈行为的客户,及时采取预警,避免客户继续进行欺诈行为,从而减少欺诈行为给银行带来的经济损失。整体来看,客户的工作、生活越稳定,受教育水平和收入水平越高,发生欺诈的比例就越低。对于欺诈行为地域性差异明显的结果,银行可以调整旗下各地支行的营销策略。

在做分析的时候,要循序渐进,先确定大的目标,再细分小的目标,从小到大一一实现,不断深入地挖掘数据,发现数据背后隐藏的信息。数据分析的主要流程是:明确分析目标、数据收集、数据预处理、建模分析、结果评估、结论整理及建议,通过对现状、原因等分析最终实现预测分析,确保数据分析维度的充分性和结论的合理有效性。

在做可视化图表的时候,要根据想表达的信息,确定图表的类型,各个轴的区间,如果是条形图,还得调整好每一条的宽度,让图表的数据表达得更明显。图形尽量不做成3D的,因为3D的图不好确定顶点在哪,给阅读图表带来了不便。

分享扩散:

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表