一、选手简介
1、选手介绍
帆软社区用户名youyoudewo,个人感兴趣的方向和领域-数据分析。
2、参赛初衷
希望通过比赛实践提升BI工具的使用方法和技巧,去年只得了个参与奖,希望今年比去年有进步!
二、作品介绍
1、业务背景/需求痛点
天津建设工程信息网的数据公开透明,可以通过对其的数据分析去探讨整个工程建设市场的趋势。
2、数据来源
自选数据:通过采集器获取“天津建设工程信息网”网站上公开的施工类型项目招投标信息(数据截止到2023年7月20日)和企信通上的企业部分工商信息。
3、分析思路
拿到数据后的分析思考过程(详见思维导图):
· 通过项目总概况、RFM模型、企业画像和帕累托模型,主要是围绕中标企业的角度对招投标项目进行了探讨。
3、数据处理
拿到数据后,首先是对整个数据进行了初步的了解,对数据的每个指标内容进行了思考。
鉴于数据的时间跨度比较大,有部分建筑企业已经更名,所有有更新匹配最新的企业名称便于后期统计分析和对项目所在区域和企业所在省份的更新。
数据导入自助分析场景库后,首先是对数据进行了左右合并,将企业的工商信息表和招投标数据表进行了一对多的合并;
表合并后因为只有项目工期开始和结束的日期,所以新增了时间差列计算出项目工期(工期 = 时间差【中标工期-结束-中标工期-开始】,天);
通过直播课上老师教的各种数据处理方法对各个指标维度进行了设置;
用分组汇总的方式按最新的企业名称把需要的三个维度单拎出来制作RFM模型,对于工程项目来说把企业划分为中标金额高的A类,中标金额低需要关注的C类和需要保持的B类。
在RFM模型的基础上分组汇总把企业所在省份和中标金额制作帕累托模型所需内容。
5、可视化报告
(1)数据含义表达和图表排版布局:
第一部分的数据总概况,按年份把项目数量和项目中标金额做了分区折线图;
第二部分的PFM模型,用了五个KPI指标卡展示了项目数量、项目的中标金额、项目平均中标金额、企业的平均中标金额和去重的企业数量,
用漏斗图制作了企业类别展示,用分组表展示了明细的企业名称、企业成立年限和企业类别相关数据,
用散点图制作了以企业最近中标距离现在的天数为数据展示、项目数量和项目平均中标金额为数据维度的企业所在省份的波士顿矩阵图(为便于查看相关数据,模型内数据均可联动);
第三部分的企业画像,用矩形树图制作了项目所在区域的项目数量和中标金额占比,
用2个对比柱状图展示了项目数量排名前10和项目金额排名前10的企业,
用8个饼图制作了不同中标金额区间占比、不同工期区间、不同企业注册资本区间占比和不同参加企业数量区间的数量&中标金额占比(为便于查看相关数据,模型内数据均可联动,并设置了不同年份的查询按钮);
第四部分帕累托模型,通过自定义图表组合柱形图和折线图,设置了80%和90%两条累计占比线。
整体大屏采用的是科幻大屏仪表板样式,每个独立组件内都设置了和科幻大屏匹配的背景,因为设置了部分的数据联动,所以在相应区域设置了数据重置按钮。
(2)通过分析得出的结论:
通过天津建设工程网施工项目信息数据大屏的展示,可看出整体上天津的项目数量和中标金额自2020年起在逐年递减,2022年开始在缓慢增长;
客户类型中占比最多的是C类企业(中标金额低),有很多企业最新中标项目都是一年前的项目了。占比最少的是A类企业(中标金额高),大部分企业都是国企性质,中标项目比较大。湖北、上海、湖南、北京这些地区企业平均中标金额较大,但除北京市以外企业流失情况比较严重,需要重点关注;天津当地建筑企业以小额项目为主,但中标次数多。
滨海新区项目数量和金额都是最高的,项目以中标金额500万金额以内、工期一年内和20个以下企业参与招投标为主,1亿元以上注册资本的企业是中标企业的主力军。
天津市、北京市、上海市、湖北省、河北省、江苏省这几个省份的企业贡献的企业中标金额占比达80%。
通过数据大屏的图表展示和数据的联动观察,天津的工程项目类招投标市场自疫情开始严重下降,参与施工项目招投标的建筑企业数量80%以上都是20个以内且在疫情后数量逐年下降,中标企业也集中在天津本土企业,外省企业参与较少,中标也较集中在实力雄厚的国企背景企业(成立年限长、注册资金高),但观察到自放开疫情后数据在缓慢增长中,可期待2023年全年的发展情况。
(3)最终结果呈现的页面布局
https://bisolutions.fanruan.com/webroot/decision/link/EGXd
三、参赛总结
1、FineBI工具
自助分析场景库的功能更多也更方便使用了,如果说还可以设置不同参数的切换展示就更完美了。
2、参赛总结
不断尝试不断学习,通过大赛让我知道了自己在数据分析上的不足,还需要更多的思考和总结。 |