一、选手简介
1、选手介绍
2、参赛初衷
作为一个坚定的小帆薯,而FineBI6.0是帆软的一个拳头产品,那我不得好好学习和使用看看,不然社区的问答都不一定会~~ 具体原因如下:
-
BI6.0上线发布很久了,暂未进行深入的使用,想借着这个机会练练手
-
和更多FineBI大神交流学习,进行数据可视化作品以及分析思维的激烈碰撞
-
后续的发展方向是全方位的数据分析师,这个也值得我尝试一下
-
大赛奖励很诱人
二、作品介绍
▮ 选题背景
最终选题:《生育率下滑的深层次分析报告》 选题总共定了三个方向,分别是 方向一:能源化工《风电清洁能源的发展趋势》 方向二:社会民生《用数据告诉你如何获得幸福》 方向三:社会民生《生育率下滑的深层次分析报告》 后面从数据取数、分析模块定化、已有分析看板比对等多个方面综合来看,最终选择了方向三。 本身,方向三我也想深入了解一下,最近几年生育率下滑的问题很严重,国家在2016年和2021年实施了二胎、三胎政策,效果并不尽人意。单单对人口来说,人是家的基础,也是国的基础。生育率下滑,将导致新增人口减少,进而导致人口减少,将产生劳动力短缺、人口老龄化问题等一系列问题。
所以,生育率下滑值得重视。
1、业务背景/需求痛点
1.1 场景介绍
【场景剧:以下仅供说明】
①大家好,我是帆薯,我所在部门是国务院计划生育行政部门的数字化部门;
②今天,领导XX对我说:"小帆,给你安排个任务;你去查一下生育率相关数据,整理一下,看看为什么生育率还是下滑个不停啊!"。
③我说:"好的,领导"。
④领导又继续说到:"生育率这个问题真得头疼,上升太快也头疼、下降太快也头疼。最近几年,为了控制生育率下滑,颁布了很多政策也不见成效;问题究竟出在哪里"。“对了,小帆,你到时直接弄一份数据分析报告吧,一定要通俗易懂还要数据可靠,到时我也好去给上面的领导汇报。”
说罢,领导就离开了。
1.2 需求痛点
该需求的面比较广、比较大,进行定位量化分析的难度较高。同时除了数据收集本身之外,还要定位出最核心的指标和方向,确保深入分析的方向的可靠、科学。 进而定位出问题发生的最起始的原因。
2、数据来源
2.1 数据来源
本次比赛数据来源为自选数据,根据实际分析框架,查询和梳理出对应数据 来源包括:
2.2 指标口径
所属模块
|
指标名称
|
统计口径
|
数据一览
|
总人口数
|
最新年度的总人口数据(万)
|
出生人口
|
最新年度的总出生人口数据(万)
|
同期出生人口
|
最新年度的同期总出生人口数据(万)
|
出生率
|
最新年度的出生率数据‰【出生人口/总人口】
|
同期出生率
|
最新年度的同期出生率数据‰【同期出生人口/同期总人口】
|
现状分析
|
省份出生率
|
最新年度的各省份出生率情况【以死亡率7‰均值进行预警展示】
|
年度出生率
|
各年份下的出生率数据和趋势【【以死亡率7‰均值预警】
|
年度新增人口
|
各年份下的出生人口数据和趋势
|
年度净增长人口
|
各年份下的出生人口和死亡人口之差
|
人口预测
|
按照当前出生率进行人口预测【人口总数】
|
人口预测下的男女占比
|
对应年份下的人口总数下的男女占比
|
出生率下滑分析
|
人口年龄结构
|
历史年份各年龄层级的人口总数对比
|
各年龄层男女比例
|
各个年龄层下男女占比对比
|
男女比例趋势
|
以年度对比男女比例变化【男生人数\女生人数】
|
结婚登记数
|
对应年份下的结婚登记人数
|
同期数据
|
对应年份的结婚登记人数的同期数据
|
结婚登记同比
|
(结婚登记数-同期数据)/同期数据
|
离婚登记数
|
对应年份下的离婚登记人数
|
净结婚
|
结婚登记数-离婚登记数
|
出生人口同比
|
(出生人口-同期出生人口)/同期出生人口
|
不孕不育分析
|
不孕占比
|
不孕人口中的男女占比
|
各年龄段不孕率
|
对应年龄段的不孕人口占对应总人口
|
不孕不育率
|
对应的不孕不育人口占总人口比例
|
3、分析思路
3.1 思路分析
本次分析报告采用的是探索式分析→基于问题去查找原因,一层层深入解析和下剥,进而发现可能的原因,收集数据去验证方向的正确性。
最终确定的分析流程如下:
(1)数据一览:直观的看数据,发现数据中存在的问题或者说异常
(2)现状分析:以当前指标数据为基点,查看对应的各维度及历史数据,验证这个问题是当前产生还是历史态势的延续,并针对延续做出预测;
(3)出生率下滑分析:从出生人口的核心要素--一对适婚适孕的男女双方在构建起了稳定的婚姻,以此为基点进行分析,验证人口比例、人口年龄结构、结婚率下滑、不孕不育率升高【这里采用拟合和对比分析】的原因
(4)不孕不育分析:从两个当前核心因素结婚率下滑和不孕不育率升高进行分析和验证,其中结婚率下滑为已有数据分析,不进行进一步分析,对不孕不育率分析,依靠数据,验证方向的正确性
(5)总结:对以上分析做汇总并提供问题解决方案;
3.2 分析框架
3.3 分析模型
本次分析采用的是探索式分析【发现问题→确定问题→深入挖掘→验证问题→总结问题】,一步步推导和验证,确定最终根源
使用的具体分析方法如下:
对比分析法:看数据趋势,数值对比,数值预警等多种对比方法,多维度对比
模拟预测法:借助数据情况,结合预测工具进行未来数据的推演和展示【人口预测】
穷举法分析:对可能情况进行穷举比结合数据进行验证【生育的四种可能和对应下属分析】
相关性分析法:应用趋势的拟合分析和对比,寻找相关性;
趋势分析:对数据进行拟合,查看数据的明显趋势和方向;
漏斗模型:直观看到对应群体的数据差异
4、数据处理
在本次数据分析中,因为数据涉猎较多,对数据的处理也是很常见的,其中使用较多的有行列互转、公式设置、数据合并、聚合运算等
①行列互转:因为图表的限制和呈现要求,这个场景使用的比较多;说实话,这个用BI处理是真的方便,一键搞定
②公式设置:主要有数据中进行公式设置、新增计算列和利用BI自带的快捷运算
③数据合并:将多个跨数据集的数据进行合并运算和展示
④聚合运算:对数据进行聚合展示
5、可视化报告
5.1最终效果图
查看地址:https://bisolutions.fanruan.com/webroot/decision/link/BPtk
5.2 图表排版布局和配色
本次分析采用浅色系配色,基础配色参考育娲人口的人口分析报告
其中基础配色为蓝、红、橙三色【如下】,附带其余颜色【基本略偏向浅色系】
一般而言,蓝色代表当前值、橙色代表同期值;或者蓝色为男生、红色为女生等等,具体看图表图例及下方说明
布局按照分层排布布局,按照分析层次【标题】+图表数据+数据说明为一个单元
5.3 数据含义表达及结论
5.3.1数据一览
图表排版布局:
数据说明:
a、本单元主要是排布五个总览数据,分别是同期人口、出生人口、总人口、出生率和同期出生率,下方为对数据进行解释和说明, 发现问题并引入分析。
b、对应内容为2022年出生数据直观来看,2022年新生人口为956万,首次跌破1000万,与 同期相比下滑9.98%;出生率为6.77‰, 同比下滑9.97%;生育率下滑显而易见,现在我们深入看看
5.3.2 现状分析
图表排版布局:
数据说明:
a、本单元主要是排布三个图表,包括省份出生率、近20年新增人口和出生率分析、当前生育率下的人口预测,该单元承接上方数据反应的问题,以当前指标数据为基点,查看对应的各维度及历史数据, 验证这个问题是当前产生还是历史态势的延续,并针对延续做出预测;。
b、对应内容为
新增人口率=出生率-死亡率;其中,随着我国医疗技术的发展,现如今人口死亡率相对稳定【稳定在均值7‰】,虽然近几年因疫情原因有些许上升,但整体可控;人口的关键因素还是人口出生率。对现状分析不能看出以下两点:①通过从【省份出生率】【近20年新增人口及出生率分析】两个方面来看,本年的出生人口和出生率大幅度下滑并不是个例,而是趋势的延续;只是在2022年跌破了0增长的警戒线【均值7‰】,单单从省份数据看,甚至存在较多省份或者直辖市早已跌破0增长的警戒线,其中较为明显的是【上海市、吉林省、辽宁省、天津市等等】②以当前人口出生率趋势进行推演,从2023年起,我国人口数量将会进入下降通道,而且趋势渐渐加快【当前生育率下人口预测】;但男女比例随着实际推移,渐渐变小。
5.3.3 出生率下滑分析
图表排版布局:
数据说明:
a、本单元主要是排布七个图表,包括人口结构趋势【各年份下的人口结构变化,系列为人口结构,以万人为单位对比】、各年龄层男女比例【对比条形图,将男生占比和女生占比进行对比】和男女比例趋势【折线图:各年份的男女比例情况;同时加了一个拟合线,查看趋势】组合成轮播图,结婚登记数趋势【组合图:蓝色柱子为当期数据,橙色为同期数据,折线图为同比】,净结婚对比【组合图:上方为堆积面积图,面积差值几位净结婚数,同时柱子为净结婚数】,生育的四种可能【矩形树图,罗列数据】,结婚登记和出生率同比线性拟合对比【折线图:红色为结婚登记同比线,蓝色为出生率的同比,两者进行线性拟合和对比】,该单元对上方数据反应的问题进行深入的刨析,并进一步分析当前的数据;。
b、新生儿的诞生从基础上来看,一般而言,需要由一对适婚适孕的男女双方在构建起了稳定的婚姻之后才能够产生的;基于此,我们从【人口年龄结构】、【人口男女比例】、【结婚登记数据】、【拟合分析】四方面来进行深层次的数据分析,
从数据上不难看出:
①人口年龄结构:近几年,随着时间推移,我国适婚适孕人口比例不断降低,老龄化人群增高,而这也影响了我国人口生育的基数;
②人口男女比例:因为各种历史原因,我国男女比例严重失衡,特别2013年整体男女比例不断扩大;到2020年以后才有所缓解;
③结婚登记数据:结婚登记数据对出生人口而言,是一个更具前瞻性的指标;通过数据很明显可以看出最近几年结婚登记数大幅度下滑,而与之对应的是离婚登记数的大幅度上升,进而导致净结婚对数大幅度下滑;婚姻是家庭的基础,也是新生儿诞生的基础,这也导致了出生人口下滑的关键原因;
④另外,对人们而言,是否生育也有四种考量,其中导致生育率下滑的主要有不想生就不生、想生生不了两种。其中,不想生就不生的表征就是结婚率的下降和离婚率的上升;而通过对结婚登记同比和人口出生率同比进行线性拟合对比分析【两者存在强关联的非线性关系】,不难发现出生率的下降趋势要强于结婚登记下降趋势,即存在导致生育率异常下降的原因,这里就是第四种考量--想生生不了【不孕不育】
导致生育率下滑的主要原因有三点:a、历史原因导致了当前的人口年龄结构不均衡和人口男女比例失衡,进而使得当前适婚适孕人口基数下降;b、随着国家的发展、人民生活水平&生育观念的改变等等,人们对婚姻、生育的态度也大不相同,导致当前结婚率下滑【结婚率下滑、离婚率上升】进而影响生育率的下滑,更多结婚率分析可以查看已有分析BI看板【事业告急——月老的KPI下降分析 https://bisolutions.fanruan.com/webroot/decision/link/4EFV】;C、对数据进行深入挖掘之后【是否生育有四种考量,其中导致生育率下滑的主要有不想生就不生、想生生不了两种。其中,不想生就不生的表征就是结婚率的下降和离婚率的上升;而通过对结婚登记同比和人口出生率同比进行线性拟合对比分析【两者存在强关联的非线性关系】,不难发现出生率的下降趋势要强于结婚登记下降趋势,即存在导致生育率异常下降的原因,这里就是第四种考量--想生生不了【不孕不育】】,发现存在导致生育率异常下降的原因--不孕不育问题的扩增。
5.3.4 不孕不育分析
图表排版布局:
数据说明:
a、本单元主要是排布五个图表,包括不孕占比【扇形图:展示现在不孕的男女占比情况】、男性不孕原因分析【词云:对当前的男性不孕原因的高频词汇进行展示】、女性不孕原因分析【词云:对当前的女性不孕原因的高频词汇进行展示】、各年龄段不孕率【漏斗图:展示各个年龄段的变化】、不孕率趋势【折线图:近几年来的不孕率趋势变化】,该单元从两个当前核心因素结婚率下滑和不孕不育率升高进行分析和验证,其中结婚率下滑为已有数据分析,不进行进一步分析,对不孕不育率分析,依靠数据,验证方向的正确性;。
b、对应内容为
通过对上层的分析,我们发现导致生育率下降的另外一个核心因素可能是不孕不育率上升,基于此我们进行数据验证,通过数据分析结果,我们很容易看出来,验证成立。
最近十年来,在适龄人口中,人们的不孕不育率趋势不断上升,其中男性的不孕不育率远高于女生,而且随着年龄的升高,这个现象更为严重。最终,和结婚率下降、人口年龄不均衡、男女比例失衡等一起导致了人口生育率的持续下滑。
5.3.5 报告总结
图表排版布局:
数据说明:
a、本单元主要是报告总结,对以上分析做汇总并提供问题解决方案;单元排布三个图表,包括生育率下滑【雷达图:影响下滑的四个方面和说明】、不孕不育解决措施【条形图】、结婚率下滑缓解措施【条形图】。
b、对应内容
通过我们的探索式分析【数据总览发现问题→现状分析确定问题→出生率下滑分析深入挖掘→不孕不育分析验证问题】确定了生育率下滑是由历史原因和当前原因【人主观原因和客观原因】等多个方面导致的,通过单一的政策是很难实现问题的解决的,核心是要对这个问题重视起来,并针对当前核心因素结婚率下滑和不育不孕率上升进行着手才有望缓解。
三、参赛总结
1、FineBI工具
结合着FineReport的使用经验,不难发现,FineReport是知道要什么指标,直接取数呈现即可,并在此基础上进行分析。FineBI则是要更多的思考和挖掘,通过结果查找原因,进而从根本上解决问题。
2、参赛总结
本次参赛的时间其实没有把握的很好,特别在7月底和8月初的时候,手里面自己本职工作的工作量比较大,以为自己要做不完了。不过在最终时刻,还是赶上了。在参赛的过程中,说到困难,在学习和使用FineBI的过程中其实还是蛮顺利的【毕竟以前一直在用】,核心的困难实还是在分析的思路和架构上。
从某种角度来说,探索式分析确实比固定报表要费脑细胞一些,平时的需求就是做报表,用户要什么就做什么,顶多逻辑或者效果麻烦一点;但是BI分析探索时却不一样,你知道数据有问题,但是究竟哪里有问题,没人会告诉你,你需要结合数据一点点去分析查看,并结合你的专业知识或者百度去判读,得出分析结果,并进行更加进一步的分析,用数据去验证,进而形成闭环,得出可靠的结果。
说到这里,我就想起一个故事:
1923年,福特公司有一台电机坏了。很多技术人员都修不了,拿它没办法。当大家都焦虑万分的时候,有人推荐了一家小工厂的一个修理工。这个修理工人来了 之后,只要了一张垫子,然后铺在电机旁边,专注地听了三天。最后,他在电机的一个部位用粉笔画了一道线,并写上:“这里的线圈多绕了16圈。”福特公司的技术人员按照他的建议把电机拆开,终于修好能正常运转。福特公司的总裁福特先生得知电机修好以后,准备给这个修理工人支付一万美元作为酬金。经理很疑惑:“简单画一条线就值一万美元吗!”要知道,当时美国很多经验丰富的技术工人月薪也只有5美元左右。这个修理工人看到大家疑惑不解,就在账单上写了一句话:“画一条线,1美元;知道在哪里画,9999美元。”
正如故事中所讲,重要的不是那条线,而是知道那条线画在哪里。所以,在这个数据化时代,希望各位能够利用好这个BI工具,去定位好那一根导致企业经营异常的线,进而实现企业的正常运转。
|