1.1.选手介绍 团队名称:贰万组 团队组长: - 徐姗姗(北京泛鹏股份有限公司),从业于银行内资产负债项目咨询工作,负责产品操作、数据分析、业务方案和汇报材料制作等工作。擅长使用SQL进行数据查询和数据分析,可使用Python、Datahoop进行数据分析和建模工作,熟练掌握EXCEL、Gephi等可视化工具对大量银行数据进行分析展示。
团队成员: - 张吉瑶(第四范式),从事于人工智能领域,平常接触大数据分析、数据分析工具等内容,熟悉SQL、Python等数据分析工具。
- 陈耀(北京泛鹏股份有限公司),从事于银行内系统开发工作,熟练掌握Java,js,vb等编程语言,熟悉IDEA、Eclipse、Visual Studio Code、xshell、Xmanager等工具。
因何结缘:团队成员是公司的同事或大学舍友,因为帆软的可视化比赛聚集在一起,成员各有所长,在本次比赛中分工合作,发挥各自优势,共同完成本项作品。 团队标语:拿上贰万,恰饭恰饭
1.2.参赛初衷 - 目前银行内普遍使用帆软作为报表工具,团队成员的日常工作中都涉及大数据分析,希望通过更先进的工具直观展示数据关系,挖掘数据价值。同时,工作中需要向领导、客户进行汇报,直观的可视化展示会更具有冲击力,表达力也更明显。
- 通过比赛可以学习大量视频教程、论坛经验和专家指导,希望通过亲生经历和实践提升工具技能,提升数据分析思路和工作效率。所以希望通过大赛学习更多目前主流的报表分析软件FineBI,也为FineReport的使用奠定基础;
- 团队成员都对数据可视化分析具有浓厚的兴趣,EXCEL可应用于日常的简单数据可视化,帆软在多维度、大数据的展示方面更有优势;
- 大赛奖励非常具有吸引力,帆软专家团队项目指导服务价值高,CPDA证书是非常具有权威和公信力的数据分析师考试。
2.场景介绍
2.1.业务背景介绍&数据来源
(1)业务背景: - 银行部门内部需要经常进行金融产品投资或者受客户委托进行金融产品交易,属于商业银行学的范畴。日常工作包括投资分析、投资预估、投资决策、风险防范(应收应付账款分析等)和收益分析等。
- 银行投资债券,不仅仅是为了表面收益,很多时候要综合考虑流动性管理、资本占用、税收和监管要求等多个因素。比如短债和利率债,在银保监会和央行给银行设置的监管体系中有很高的地位,能够帮助银行在流动性监管考核要求中达标;地方债利于维护好与地方政府的关系。为了解部门内投资情况和收益率情况,需要在各个维度上对其债券持有情况和价格情况进行分析。
(2)需求背景: - 银行的投资行为是一个在经济周期、监管和负债三方约束下追求利润最大化而形成的行为。
- 银行每个阶段需要整理并汇总投资报告,每个投资部门每月或者每周根据交易数据做投资分析,从每个银行销售部门人员那获取销售数据,并根据业务完成情况进行分析,完成经营分析报告。另一方面,需要整理交易数据,完成投资结果分析数据报给各部门负责人,由银行领导根据指标进行考核,比如到期收益率。
- 银行领导根据自身对经济、监管和政策的预期来决定银行资产配置重点方向,在了解目前投资情况后,查看需要调整的地方,引导之后对债券结构的配置。
(3)数据来源: 使用企业数据: - BOND_DATA_INFO(债券详细信息);
- BOND _YIELD_DATA(债券收益率)
- BOND_TERM_INFO(债券期限信息表)
- PRICE_CHANGE_DATA(价格变动率)
(注:企业数据银行内提供数据,已将投资机构脱敏,分别为AAAA、BBBB、CCCC、DDDD、EEEE、FFFF、GGGG、HHHH,实际为银行内部门,比如金融市场部)
使用自选数据: - BOND _YIELD_CHANGE_DATA(具体债券收益率变化情况)
(注:由于数据分析需要,自选数据来源于中国债券信息网)
2.2.分析思路 查看数据后,首先确定分析目标:了解银行内投资机构(银行内各部门)的债券投资情况,根据政策或自身发展需要确定需调整的债券,并提高投资收益率。
分析方法采取结构化分析法,从总体情况到具体债券进行一步一步透视,最后得出论点,挖掘数据价值,为行内债券投资提高参考建议。
以下为拿到数据后分析思考的过程: - 根据债券交易数据,债券详细信息等数据表,重点考虑了投资机构、债券品种、债券名称、中债估值、到期日、持仓余额等多个字段,将字段分为维度和指标字段,大概方向有投资机构持仓债券品种分析、报告日持仓余额、估值分析;
- 总体上,从债券发行人地区分布情况、债券币种、对各投资机构的投资情况进行汇总查看,分析目前投资机构的投资结构和投资偏好;
- 然后从债券等级、投资期限方面探索和价格的关系,通过债券估值进行分析,另外通过FineBi软件计算出“价格变动率”((中债估值 - 票面金额) / 票面金额) ,可展示报告日中债估值相对于债券票面金额 (100) 的变化情况。价格变动率越大,说明债券估值越高,市场价值较大,如果在高价买入,到期收益率较低;价格变动率越小,说明债券估值越低,被低估时可买入,但要评估债券实际价值,预测其未来发展趋势;
- 具体方面上,基于以上分析提取具体债券名称,从“中国债券信息网”提取具体债券在其他期限的数据情况,分析其报告日后估值和到期收益率发展情况,作为分析和验证数据。
每个分析方向的结构脑图:
2.3.数据整理 参照FineBI产品学习教程,对数据进行了以下处理: 1、在【数据准备】中添加EXCEL数据表,包括企业数据和从“中国债券网”中数据; 2、基于EXCEL表添加自助数据集,可对数据进行编辑和操作。 3、自助数据集中,对数据进行了过滤、分组汇总、新增列和排序操作。 (1)过滤数据: 为避免空值和异常值的影响,对“债券信息表”进行了过滤操作,将“中债估值”字段设置为大于10。
(2)分组汇总 EXCEL原表“期限分类汇总表”中投资期限为92D-3652D共459种,为文本格式,不能直接进行分类。先通过EXCEL统一去除“D”,处理为数值格式后导入自助数据集进行分类。 为方便后续的图表展示,将期限设置为五组,分别为“0-1000天”、“1000-1500天”、“1500-2000天”、“2000-3000天”和“3000天以上”。(分类依据为各组债券数量相似,以保证指标客观)
操作步骤:(参照以下截图) ① 通过【数据准备】进入自助数据集,点击【添加表】,选择自助数据集,选择要编辑的EXCEL表;
② 进入自助数据集后,点击左侧的【➕】,选择【分组汇总】; ③ 将“投资期限(数值)”字段放入右侧的【分组】中,点【区间分组】 ④ 将五个组的临界值填入后点击【确定】 ⑤ 加入其他需要的字段后,形成分类汇总后的数据表。
(3)过滤空值 为了详细了解各个投资机构的债券种类,中债估值以及价格变动率,我们对原始的价格变动率图表进行了如下处理: ① 首先,通过数据处理,过滤掉表格中存在的空值,留下有效数据。 ② 然后,通过简单的分组汇总,以不同的投资机构为基础,将中债估值,价格变化率以及本季度的最新评级进行汇总,以便之后对比不同机构的投资情况。
2.4.完成分析报告 分析报告主要分为三部分,包括图表的选择和设置、通过分析得出的结论和最终结果呈现的页面布局: (1)可视化图表的选择和制作步骤 - 根据整理的数据选择合适的图表(进入FineBi网站-模板管理观摩模板图,挑出最匹配现有数据的图表)。通过分析,根据要展示的数据选择了分组表、柱形图、散点图、区域地图、热力地图、漏斗图等图表类型,以便于直观展示论点。
- 选择好图表,将维度字段拖入右侧【横轴】、【纵轴】中,构成图表的横轴和纵轴。( 根据图表的不同,进行不同操作)
- 进入FineBI帮助文档网站:https://help.fanruan.com/finebi/,根据操作步骤,包括表格属性和组件样式,对图表进行优化。
- 再根据视频教程进行二次优化组件,比如交互属性等先进功能。
- 进入仪表板,将各图表进行展示分析,根据需要设计辅助图表。
(2)通过图表的分析,得出以下结论 - 从总体的购买债券价格表中可看出,CCCC投资机构的持仓债券面额最大(11.5亿),且平均价格较平稳。AAAA的投资面额相对较高(6.7亿),平均估值价格变动率最高,为1.19%; BBBB的投资面额最少,且估值变动率最低,为-0.79%(表1)
- 分析各投资机构购买债券的币种地图后可看出,大多数分布在亚洲,少数分布在欧洲和美国;(图1、图2)
- 在发行人区域地图中,设置图例为只显示 “报告日持仓余额大于80万元” 的地区,可看出投资机构购买的债券发行人主要分布在东南部和东部(图3)
- 由此深度分析各投资机构的债券品种持仓情况,发现其投资结构明显不同。 AAAA机构主要购买国债、外币企业债和政策性金融债等,BBBB机构主要购买中期票据、企业债和金融债。同时,EEEE、FFFF和GGGG偏好于购买外币债券。(图4)
- 分析报告日投资机构的持仓余额后可直观看出,购买债券集中在银行业、运输业、资本货物、能源、多元金融以及商业和专业服务上。其中,持仓银行业的债券余额最高,为5.2亿元(图5)
- 不同债券品种的持仓余额图表示出,投资机构偏好于购买财政部代发地方政府债(4.7亿)、中期票据(3.4亿)、以及金融债(2.4亿),持有地方政府债利于维护与地方政府的关系(图6)
- 图7代表了统计日不同投资机构所持有债券的评级情况。由图可知,DDDD机构所持有的债券数量最多,且评级大多为AAA。债券持有总量其次为机构AAAA以及CCCC,并且这两个机构的债券中AAA评级的数量最多。由此可知,机构投资者偏好评级较高的债券品种。(图7)
- 根据图8,圆形面积代表着该评级债券的平均价格变动率,评级越高价格变动率越大。并且,各投资机构偏好够买评级高的债券,而这些债券往往具有较高的价格变动率。(图8、图9)
- 通过图表展示价格估值较高的投资机构购买情况,由于AAAA机构的平均估值价格较高,所以对其详细分析。另外,出机构投资在投资过程中应该注意的问题,使其在之后的投资中可以多加关注。由于BBBB的债券估值价格普遍较低,需对其倒数最低的债券进行关注。(表2、图13、图14)
(3)排版布局以及设置颜色思路 ①排版布局 仪表板的布局主要按照数据分析的逻辑顺序布局,达到标题明确,逻辑连贯。将图表的大小和位置进行调整,根据图表内容确定横版或竖版,并且考虑文本和图表位置的协调。 - 首先,介绍了各投资机构的投资总体情况,包括价格情况、债券品种结构等。
- 然后分析债券评级与价格变化率的关系。
- 探索债券收益率的影响因素。
- 最后,列出各投资机构的具体投资情况,对具体债券进行分析。
②颜色设置 - 参照银行内颜色偏好,将整体设置为“蓝色”为主,可体现的较为正式,专业性较强。为增加冲击力和对比性,将仪表板背景设置为“黑色”。
- 对于具体图标的颜色,设置标准为:整体协调一致,颜色的区分可说明论点,凸显重点。通过将指标增加在图表【组件样式】中的颜色,可以通过指标的大小进行区分,以下为颜色设置示例:
在“各投资结构持有的债券品种结构”中,将“报告日投资机构持仓债券余额”字段添加到【颜色】下,点击字段设置颜色为连续渐变,余额值越大,颜色越偏紫色,余额越小,颜色越偏蓝色。由此可通过颜色判断投资机构对债券品种的持仓情况。 2.5.附上最终作品
2.6.总结
这次帆软可视化比赛对团队来说既是一次挑战也是一次机遇。我们三个组员从开始时对帆软的基本了解,到现如今可以熟练的运用它来进行分析,团队成员在这个过程中不仅学到了如何运用帆软软件,而且学会了分析数据方法、撰写报告等内容。
比赛刚开始,在实际处理数据时,团队面临银行债券数据要求专业性高、数据字段含义复杂、仪表板数据缺失等问题,但通过后续的学习与查找克服了这些问题。比如在之后使用帆软进行数据分析时,一起观看并讨论了视频教程,通过取消联动解决了数据变动和缺失的问题。我们组员三人,从开始时面对数据的一筹莫展,随着这三个星期的学习与准备,也随着空空的仪表板一点点的充实,而豁然开朗。在此过程中,也感受到了团队合作的重要性,通过分工明确、互相帮助,才能共同完成这项任务,收获到了完成任务的快乐和友谊。总是有同事或前辈告诫说:要珍惜年轻的时候。之前虽然知道但不能完全理解,参加完比赛后发现:要趁年轻,多和志同道合的人做想做的事、学习更多的知识、做有意义的事情。
万事开头难,这次帆软可视化比赛对于我们来说是大数据可视化分析的重要节点,从FineBI中感受到了现在数据分析工具的强大,不需要繁琐的步骤,通过简单的操作(拖拉拽)就可完成大量的、复杂的数据整合、计算和过滤等功能,方便业务人员使用,节省工作时间,可从不同维度以及维度组合对数据进行分析,利于大量数据的价值探索,为企业创造价值。感谢此过程中帆软老师为我们讲解工具、解决问题!感谢其他成员的经验分享!感谢帆软比赛将我们贰万组成员联系在一起!在以后的日子里,我们会深入的了解并熟练的使用帆软进行数据分析,将帆软应用于日常工作中,提高工作效率,挖掘数据价值,让帆软伴随着我们在银行业及各个领域发光发热,为促进智能大数据时代的发展贡献力量!
|