1.选手简介
1.1选手介绍
团队名称:未来领导力
团队组长:
费清凤(电子科技大学),电子科技大学经济与管理学院工商管理系研究生,擅长数据分析、方案制作和设计排版等,熟练使用EXCEL、Python和FineBI等工具进行数据分析和数据可视化操作。
团队成员:
郭秋婧(电子科技大学),电子科技大学经济与管理学院工商管理系研究生,在麻省理工斯隆商学院学习机器学习与商业分析项目,并以优异成绩完成项目学习。本科是金融工程专业,熟练掌握金融相关专业知识,平常对大数据分析等相关内容感兴趣,可使用Python进行数据分析和建模工作,熟练掌握运用EXCEL、FineBI等可视化工具对大量银行数据进行分析展示。
蒋怡(电子科技大学),电子科技大学经济与管理学院工商管理系研究生,熟练掌握EXCEL、Python和FineBI等,擅长数据分析和文案写作等。
因何结缘:团队成员是大学同学,因为帆软的可视化比赛聚集在一起,成员各有所长,在本次比赛中分工合作,发挥各自优势,共同完成本项作品。
团队标语:未来领导,逐梦未来!
1.2参赛初衷
目前银行内普遍使用帆软作为报表工具,团队成员对银行的大数据分析感兴趣,希望通过更先进的工具直观展示数据关系,挖掘数据价值。
通过比赛可以学习大量视频教程、论坛经验和专家指导,希望通过实践提升工具技能,提升数据分析思路。
团队成员都对数据可视化分析具有浓厚的兴趣,EXCEL可应用于日常的简单数据可视化,帆软在多维度、大数据的展示方面更有优势;
帆软专家团队项目指导服务价值高,通过参赛不仅可以得到指导提升能力,还能有机会获得丰厚的奖品。
2.作品介绍
2.1需求痛点:
因为疫情和经济的影响,很多房屋贷款出现断供的情况,给银行带来了不小的损失,我们的分析目标主要是研究影响房屋贷款违约的因素,为银行贷款业务给出意见。我们的数据包含了房地美和房利美从2000年到2006年的房屋贷款信息,为了更好的分析,我们将我们的分析限制在为了居住原因贷款的单一家庭,且贷款期限均是30年的贷款产品。
2.2数据来源
本文的数据来自麻省理工大学机器学习老师陈辉教授。
2.3数据清洗
(1)去掉空值
- 将三张csv文件合并,并去掉重复的列。
- 修改非日期格式为日期格式
2.4分析结果
(1)客户基本情况分析
为了直观的显示客户最基础的信息对违约率的影响,我们大多选择了仪表盘的形式,主要是因为它读数直观、对比明显。从规模上来说,房利美的住房贷款规模更高,但从图中我们可以看到,房利美的房贷违约率要高于房地美,从中我们可以归纳出,对于银行来说,要控制规模,谨防盲目扩张带来的高违约率。
从第二张图我们可以看出首套房的贷款违约率要高于拥有不只是套房的贷款者,这可能是因为拥有不止一套房的贷款者经济实力更好。
从第三张图我们可以看出,对于只有1个借款人的房屋贷款违约率要高于有两个借款人的房屋贷款违约率,且相差值更大,从银行角度我们可以发现,多1个借款人可以降低房屋贷款借出后的违约率。
为了更好的分析贷款公寓数量对违约的影响,我们放弃了仪表盘的形式,改用玫瑰图的形式,这主要是因为玫瑰图可以容纳更多的变量,从图形上来看,买4个公寓的借款人最多,且违约率越高,对银行来说,对贷款4套公寓的借款人风险控制应该更为严格。
(2)全美贷款地图
房地美和房利美的贷款网点遍布全美,为了更好分析地域对于房屋贷款违约的影响,我们制作了房屋贷款地图,为了让数据更方便查询,我们还制作了分组表用于显示各个州的贷款情况。
从两个图来说,从南到北,房屋贷款违约率从小到大。贷款率最小的州包括北部的蒙大拿州、北达科他州、南达科他州,贷款违约率最大的州包括内华达州、密西西比州,阿拉斯加虽然在北部,但是贷款违约率位于第二梯队,介于0.05-0.1之间,这和部分人的认知有很大差异,因为我们知道美国的经济一直是南强北弱,大部分人的认知可能是发达城市贷款违约率更低,事实确是相反的,对于银行系统来说,了解各地区的贷款违约情况,对违约率低的城市放松政策,违约率高的城市收紧政策,更有助于控制房屋贷款违约率,而不是应该仅仅依靠经济状况制定贷款政策。
(3)宏观因素分析
从宏观层面我们选取了三个指标,分别是FHFA房价指数,是由房地美和房利美统计的提供贷款的房屋的价格变化指数,以及30年期固定贷款利率和3个月国债利率。因为贷款利率和国债利率一定程度上揭示了利率水平,所以放在一起分析,它们与房价指数分开分析。
从图中我们可以看出,30年期固定贷款利率因素高于国债利率,但是相应的变化大体一致,房贷违约率不受这两个因素的影响,房屋贷款违约率从图中来看一直很平滑,从2006年波动开始剧烈,2008年违约率猛增,这也很正常,因为我们知道2008年的经济危机正好是房屋贷款违约开始蔓延的。
同理,可得房价指数也对违约率没有显著影响。
但是我们从图中可以看出贷款利率、国债利率、房价指数在2006年后开始大幅下降,此时违约率开始波动,我们可以从这三个指标预测贷款违约率,从而更好的做好风险防控。
(4)微观因素分析
宏观分析主要是大的经济指标,微观是分析贷款人的贷款信息。
第一张图显示的是贷款利率对贷款违约情况的影响,从利率来看,利率越高,贷款违约率越高,但是利率越高,借款方能获得更多的利息收入,所以在房屋借贷时要选取合适的利率。
第二张图是借款占收入的比例对违约关系的影响,我们可以看出借款占收入比率越高,违约的可能性越大。所以银行在借出款项的时候一定要仔细核对借款人收入情况,确保其偿还能力。
第三张图显示的是贷款保险覆盖比率对违约的影响,我们可以看出抵押贷款保险占贷款总额越高,违约的可能性越大,我们猜测可能信用评价分数可能影响贷款保险率,但是从图中我们没看到相关关系,对于银行来说,贷款保险覆盖率也是风险控制应该参考的因素。
第四张图显示的是贷款金额对违约率的影响,从图表可知,借款金额越高,违约分线越低,这可能是因为信用评级高的人借款金额更高,违约率更低,所以我们在同一图中,引用了信用评级指标,从图中可以看出,确实是随着借款金额的升高,信用评级增加。
第五张图显示的是贷款金额和房屋价值之比对违约率的影响,比率越高,违约率越高,第七张图在第五张图的比率上将贷款金额改成拥有两次房贷的贷款金额之和,更能说明情况。
第六张图是信用评级对于违约率的影响,大体上来说,评级越高,违约率越低。
2.5附上最终作品
2.6总结
这次帆软可视化比赛对我们团队来说既是一次挑战也是一次机遇。因为我们都是学校学生,经验不是很足,在最初的主题选择和数据来源上遇到了困难。但很庆幸的是我们的成员十分的团结,在专业上都是各有所长,又对数据分析兴趣浓厚,很快就由擅长金融的同学确定了主题和数据。我们三个组员之前在学校已经学习了FineBI,而通过这次比赛,我们可以更加熟练地运用它来进行分析,团队成员在这个过程中不仅学到了如何熟练运用帆软软件,而且学会了如何更好地分析数据、撰写报告等,可以说是收益匪浅,收获良多。 |