【2022BI数据分析大赛】银行客户贷款综合分析
银行客户贷款综合分析
一、选手简介:
<1>:个人简介:
队长&组员:张昊泽:目前亚利桑那州立大学硕士研究生在读,有三年银行信息科技部工作经验,工作期间从事行内数据报表和帆软报表开发。个人兴趣方向:大数据分析,机器学习,数据库,数据可视化。
<2>:参赛初衷:
1:通过比赛可以学习大量视频教程、专家指导,希望通过亲生经历和实践提升工具技能,提升自身的数据分析能力。所以希望通过大赛,学习到更多目前主流的报表分析软件FineBI。
2:自身对数据库以及数据报表可视化具有浓厚兴趣,希望通过这次比赛能够结交到志同道合的朋友。
二、作品介绍:
1:业务背景介绍&数据来源:
<1>: 业务背景:
贷款是商业银行的一项重要业务,同时个人贷款是银行贷款不可或缺的一部分。那么个人贷款客户画像的重要性就显而易见,它不但可以让银行知道其个贷客户年龄,性别,学历等因素分布情况,同时对于精准营销,个贷分析都有潜移默化的辅助。
<2>: 需求痛点:
对于银行个人业务部来说,每月甚至每周都会进行机构下综合贷款数据上报以及个贷客户分析数据,基于excel报表手工统计的时间太长并且人工统计难免出错,这样会浪费大量的时间精力。此表可以协助工作人员把相关数据都进行归集,统计并上报给个人条线负责人。
2: 数据来源:
基础数据来源于和鲸社区:德国人信贷风险数据,后经过个人修改,添加,改成符合国内银行性质的个人贷款数据。
数据下载网址如下:
https://www.heywhale.com/mw/dataset/6230522b5a102300170f5c42/file
表内容如下:
字段:
使用参考数据:(源于德国人信贷风险数据表)
年龄,性别,工作,住房,存款账户,检查(支票)账户,贷款额度,持续时间,贷款目的,风险评估 (部分字段数据源表均是英文,后自行处理“住房,性别,贷款目的,风险评估”字段中的数据,翻译成中文数据存入表中)
使用自创数据:
联系方式,居住城市(区/CN),学历,征信认证,所属机构。
表内容截图如下:
3:分析思路:
下载参考数据后,需要先确定分析目标:了解银行内个人贷款客户以及贷款目的等情况,根据自身发展需要确定下一步选择贷款客户方向,贷款目的以及不良贷款的控制。
以下为拿到数据后分析思考的过程:
当拿到参考数据并且加入自创数据后:此个贷信息主要包含两个层面:
1:客户层面:包含了客户性别,联系方式,居住地,学历。
2:贷款层面:贷款目的,风险评估,贷款额度,持续时间(贷款期数),征信认证,存款,支票账户。
总体上。我们从客户的地区分布,年龄,性别,学历等情况进行汇总查看,分析目前哪些客户是贷款的主力军。
然后从贷款目的,风险评估,贷款额度,持续时间(贷款期数),征信认证,账户等层面进行分析,同时对风险评估进行过滤,只取不良贷款数据,显示不良贷款下年龄-性别占比以及住房类型占比。从而得知哪些人群是经常存在不良贷款的。这样可以让金融机构在面对大额长期的信贷业务时,更好的提高警惕,同时也可以优化银行的风控模型。
在客户地区分布图中,银行相关部门可以发掘哪些地区是贷款客户的高频发区域,同时也可以发现哪些地区占比低,这样对客户的管理以及营销区域的管理都有很好的促进效果。
以下是分析思路图:
4:数据处理:
1:联系方式数据脱敏:
REPLACE(${联系方式},4,4,"XXXX")
2: 对贷款额度进行分组
3:对贷款持续时间(贷款期数)分组:
4:对工作数值进行转译:(例如:0-非熟练和非居民)
5:创建年龄分组下的贷款额度-风险评估-性别-住房数据集:
5:可视化报告
(1)可视化图表的选择和制作步骤
1:我们需要根据整理后的数据选择合适的图表,通过分许,我们根据展示需要选择了横向柱状图,折线图,饼图,区域地图等,以便于直接展现结果,突出要点。
2:选择好图表,将维度字段拖入右侧【横轴】、【纵轴】中,构成图表的横轴和纵轴。
3:进入FineBI帮助文档,根据操作步骤,包括表格属性和组件样式,对图表进行优化。
4:进入仪表板,将各图表进行排位。
(2):通过分析得出结论:
1:从总体情况表我们可以看出,银行的总贷款额度以及总贷款人数。并且从营销机构下不良&优秀贷款额度展示中我们可以清晰的知道每个机构下不同风险下的贷款额度。从表中我们可以看到DDDD机构下的优秀贷款以及不良贷款均是最多。同时我们还可以通过机构贷款额度排名看到DDDD, QQQQ, EEEE, TTTT, ZZZZ这五家机构是贷款总额度的前五名。
2:在贷款人相关因素信息分析中,我们运用到了多个表来展现不同信息分析,其中有折线图,区域地图以及饼图。
对于不同年龄下贷款额度变化图中:我们可以清晰的发现20-40岁的人是贷款的主力军。
对于学历-统计贷款人数图中:我们可以看到贷款人中本科和研究生学历的人数居多。
在贷款客户所属地区分布图中:我们可以看到南山,福田,罗湖是绝大多数贷款人的所属区域。
在四个饼图中:我们分为了四个不同的贷款人因素分别展示:
<1>:征信认证分布图中展示出贷款人绝大多数是有征信认证并且认证成功的。
<2>:贷款期数分布图中展示出12-36个月的贷款期数占了总体的近65%。
<3>:贷款人的存储账户分布情况来看:绝大多数人存储账户是没有太多钱的。
<4>:性别占比图中我们可得知:男性是贷款的主力。
3:在不良贷款分析板块中,不良贷款的人群大部分是20-50岁的人群,其中男性居多,女性相较于男性面对透支风险更谨慎,面对透支消费的行为更理性;而有自己住处或者不担忧房租的人对刷爆信用卡的冲动更加难以克制;金融机构在面对大额长期的信贷业务时,更应该提高警惕,应该更加细致的调查申请人员的工作收入以及存款情况。
4:在工作技能-贷款目的分析板块中:大多数人的贷款目的是汽车,住房相关以及家居设备。这表示大多数人的贷款目的是为了能够拥有更高品质的生活。同时,我们也可以看到,工作技能属于熟练或者是高技能工作者(这代表他们的工作属于高精尖或者是收入较高群体),他们的贷款总额是要高于工作非熟练群体的,这表示拥有高技能的工作者贷款的几率以及贷款的额度也是要较高的。
6:页面布局以及颜色思路:
1:页面布局:
仪表板的布局主要按照数据分析的逻辑进行布局,要达到标题明确,逻辑连贯。将图表的大小和位置进行调整,根据图表内容确定是横向或竖向表,并且考虑文本和图表位置的协调。
首先,介绍了银行总贷款额,人数以及各个机构下的不同风险下的贷款总额。其次对贷款人相关信息因素进行细化分析,再对不良贷款下贷款人分布进行分析(主要看住房类型分析),最后对贷款目的以及工作技能进行分析。
2:颜色设置:
这次的报表颜色设置主要采用FineBI自带的科技大屏模式,以及采用仪表盘中的科幻大屏样式。整体协调一致,颜色区分明显。并且凸显重点。
(4):最终结果呈现:
三:参赛总结:
1:FineBI工具:
(1):对于FineBI工具来说,非技术人员也可以通过短暂时间的培训即可上手开发可视化报表,解放了技术人员。
(2):FineBI集成了FineReport工具以及Tableau工具,但是FineBI比这两个工具要简易上手的多。同时FineBI可以通过已有数据集制作自创数据集,这是Tableau所没有的。
(3):FineBI可以很好的进行数据可视化,同时对于数据分析而言,它可以用最直接的图形来展示数据,方便了数据分析人员或管理人员得出相关结论。
2:参赛总结:
由于这次比赛是个人参赛,所以需要一个人完成从选题-参考数据下载-数据集创建-数据处理-可视化报表制作整个流程,这个进程十分锻炼个人的能力,虽然自己本身有过FineReport和Tableau使用的经验,但制作可视化报表以及数据准备还是遇到了很多问题。
对于FineBI的学习,我采用的是线上线下同步进行,线上我会参与到每日课程的学习中,线下我会通过FineBI本地的一些已完成的模板进行学习,快速的了解不同图表的制作方法。同时,我也对数据处理,创建自建数据集进行了强化学习。
在这次的比赛中,我十分感谢群里解答疑惑的帆软老师,他能够尽可能的去协助我们去解决我们在开发过程中遇到的问题。同时也解答了很多关于比赛的困惑。
关于这次比赛的感悟,我觉得这次比赛对我来说是一次很好的锻炼,它能够让我一个人能亲身体会从选题-数据-图表整个流程,让我感到我是真的在做一个自己的项目,这让我觉得有不小的成就感。