个人基本情况
1.选手简介
1.1.选手介绍
帆软社区用户名:Qsiying
个人简介:目前在浙江的某大学信管专业在读的大二学生,对数据分析方向比较感兴趣
1.2.参赛初衷
希望能多提升自己数据分析的能力
希望通过参加比赛增强对此方向的认识,有初步的了解
积累经验,更好提升自己
2.场景介绍 2.1.业务背景介绍&数据来源
业务背景:数据分析了在疫情之前公司破产的一系列相关问题,在疫情之后,大规模的公司破产,但在疫情好转以后,状况好转,但需根据以往的相关数据预防公司破产情况的发生,分析将从行业,年份,地区,融资情况等方面立点分析 。
自选数据:数据来源于和鲸社区
2.2.分析思路
数据检查和数据清洗
查看公司存活时间与死亡时间的日期与存活天数,可以发现具有错误的数据(存活天数为负 数)因此对此列数据进行删除
对于死亡原因列的缺失值,用 未知 填补
并且增加年,月和死亡季度数据。
新增工作表统计同一年中新生公司与死亡公司的数量统计。
进行BI导入。
可视化报告
1整体布局与配色
仪表盘部分,整体选用仪表盘样式中的科技模板,蓝底白字,使用驾驶舱组件背景图片,以便更清楚明晰的展示内容。
2首页为标题展示与数据量
首页使用大标题组件背景,更好的展示出主要分析内容,左侧为分析数据的总量,分析总共6271个数据,横跨34年,并且将从时间、地点、行业与融资情况四个方面分析数据
3第一部分时对于破产时间的分析
分析使用小组件背景美化展示分析的图片与标题,更好的展示出分析的主要内容。
此部分主要运用了柱状图、玫瑰图、于折线图。
破产分布年使用柱状图能更好的表现每一年破产公司的数量值,更直观的表现出破产公司分布时间段。
玫瑰图使用指标数区分直径于占比,以季度区分颜色,可见第三季度分布较多,且远超其他季度之和。
对于2009-2019年新生与死亡公司数的对比,使用折线图展示新生与死亡的变化趋势,两个指标于2015交叉,死亡公司量超过新生公司量。
4第二部分对于破产地点分布的分析
此分析处于仪表盘中间,使用标题背景表明其为分布地分析,更加直观的展示内容
此分析时用区域地图展示,以记录数区分颜色,且使用区域渐变,展示破产地点分布情况,其中,北京上海广州遥遥领先,颜色鲜明。
5第三部分对于破产行业的分析
使用玫瑰图与多系列柱状图展示显示出电子商务与企业服务占破产企业大多数,死亡行业分布区分上海北京广东在各个死亡行业类型中前十行业的分布情况,可以看出每个城市在不同行业的竞争激烈程度差异。
6第四部分关于融资情况的分析
使用词云图与矩形树图展示融资情况前十与投资商前十的状况,使用记录数来区分词汇的大小,以词汇内容区分颜色,展示破产公司的融资情况占比,破产公司的投资商在总数量中的占比。而矩形树图更好展示出投资商在市场中的占比。
7第五部分对于存活时间和死亡原因的分析
死亡存活时间使用散点图,以死亡年为横轴,存活时间为纵轴,查看破产企业的存活情况,有助于分析出不同年份存活时间的变化并且可以直观看出破产企业存活时间的大致占比
死亡原因使用词云图,以原因不同使用不同颜色,以指标数区分大小,展现出大多数破产企业死亡的原因,根据死亡原因的总结,确定企业破产的共同性原因。
8分析结论
经过分析,得出以下结论
- 破产企业存活时间多为1-10年,说明1-10年多为企业发展期,面临困难较多,破产几率也较大
- 破产企业往往对融资盲目乐观,大量补贴、巨额推广,长期烧钱模式难以支撑,如为获得投资,往往极易破产。
- 往往为迎接风口迅速扩张,重资产模式拖垮良好盈利,破产行业多为电子商务、社会服务与金融等行业,面对风口行业,盲目进入,不料竞争激烈,往往极易被淘汰。
- 处于竞争激烈地区,处在北上广的企业,虽然有着企业集聚优势,但在同行的挤压下,往往难以存活。
- 对于市场信息掌握不明确,业务调整慢,处于行业竞争激烈的企业,往往会被淘汰。
参赛总结
1 finebi工具
在数据分析方面只是浅浅了解过,希望通过这次比赛更深的接触这个方向,刚上手finebi的时候其实是有点新奇,本来以为bi这种工具都像java和sql这种语言编程的编译一样枯燥,结果打开来的界面让我十分惊讶,使用的过程也很有意思,有一种探索的感觉,首页还配备了教程与工具,论坛中还有对于各种问题的解答,也算是很全面了,对于我这种边学边做,邯郸学步的同学来说确确实实是很不错了
不过使用过程中似乎几步用不到右键,很多选项都是靠点击侧边的栏选择的,不知道是不是我操作的问题,不能使用右键操作还是有点不太习惯。
2参赛总结
这次参赛也是因为机缘巧合,本来想着先把其他的内容学会再去学习bi的软件,但是都参加的,就抱着以赛促学的想法制作了,不过整体制作过程都算顺利。对于bi的运用,通过这次比赛也能更好的掌握,毕竟迈出第一步才是最困难的,通过比赛也看到了自身的不足,希望在今后也能够不断精进,不断学习。 |