【2021夏季挑战赛】疫情分析

我是社区第355936位番薯,欢迎点我头像关注我哦~

一、选手简介

1、团队选手版

团队名称:天秀队

团队组成:
        · 高源:组长,负责数据选取,仪表板制作,分析逻辑梳理;
        · 王木:组员,负责逻辑梳理;
        · 曾剑峰:组员,负责数据处理,finebi问题解答。
        
2、参赛初衷

团队参赛可以多个小伙伴快乐玩耍,有合适的主题能快速确定,每人分别提出意见,从不同角度看问题,让人耳目一新,也有学到新的操作工具,对提高数据逻辑分析有帮助,最主要是可以自选数据,非常爽啦。
        
二、场景介绍

1、背景
在新冠疫情常态化的后疫情时代,国家面临多方面综合考验,因此需要了解世界疫情的发展情况,用于判断疫情在哪些国家最严重,外防输入。

2、分析思路
分析前大家一起讨论过如何展现疫情内容,大家都提出看法,主要从趋势,排名,地图示警的方式展现:
A.地图的形式展现确诊、治愈、死亡
    1.对比历史月与最新月情况,判断疫情的整体情况
    2.2020年-至今每月累计感染人数展示
B.作治愈率、死亡率的TOP趋势图分析
    1.判定全球疫情趋势偏于好转or变差
    2.作个TOP排名,分析哪些国家做的好,哪些国家做的差
C.用其他国家与中国对比分析,分析目前国内疫情与国外的差异
    1.判定中国疫情趋势偏于好转or变差
    2.需要加强哪些国家来中人员的检查
        
3、数据整理数据整理过程,数据源为日数据,且日期均为列标题,故需要列转行,并将三张表关联起来。

截图202106302004232300.png

截图202106302004371186.png


运用python进行列转行,转换后表格式如图:

截图202106302004541306.png

以确诊表为主表,将死亡表、确诊表对应字段匹配进去,合成一张中间表全球疫情情况累计表,state字段为对应的确诊、死亡、治愈的状态,Number为对应状态的数值。

截图202106302005149909.png

由于都是累计数据,不能满足所有分析场景,故将每日累计数据拆分为每日数据,得到全球疫情每日新增表:

截图202106302005318619.png

处理好数据后,将对应的Excel文件,载入finebi。

4、完成分析报告
最上方用指标卡去展示,让观看人员掌握实时最新的全球疫情情况,并通过时间、国家、区域、类型的筛选器,让使用者能够定位查看自己想看到的分析指标;

截图202106302005597898.png

展示全球最新疫情的发展情况,累计感染多少人,累计死亡多少人,累计治愈多少人,评估疫情的严重程度。

截图202106302006125424.png

用地图展示到国家维度的感染情况,可通过下钻模式,细分到省/州的维度,这里可选择确诊,治愈,死亡三种类型。

截图202106302006271252.png

用TOP排名的方式,展示各国的确诊,治愈,死亡人数

截图202106302006476284.png

展示治愈率和死亡率的排名

截图202106302007032479.png

展示国内与海外的疫情趋势对比

截图202106302007166716.png

最终效果

截图202106302012521945.png


5、项目总结
首次做PC端可视化分析,需要克服的困难挺多的,整个过程,大家都很认真。
首先是选题,针对于严峻的疫情形势,我们不假思索地在和鲸社区上选择了全球疫情数据,之后便开始了漫长的讨论过程,主要是围绕着需要展示什么指标,能给予观看者哪些有效信息和收获等

截图202106302007559779.png

其次,是数据源问题,里面数据源格式存在一定问题,比如2021/2/21,本身格式是日/月/年,里面数据源格式错误,这里作了数据源的清理;其次是对于其中的确诊、治愈及死亡数据源作了合并处理;

截图202106302008165017.png

然后对于整体的分析思路,我们作了长时间的讨论,如下:

截图202106302008378334.png
截图202106302008527403.png
截图202106302009082883.png

最终在做完仪表板时,一种成就感油然而生,感谢帆软提供平台和数据,让小伙伴们都得到成长。


疫情分析.pdf (10 M)

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

0回帖数 1关注人数 4271浏览人数
最后回复于:2021-7-22 10:15

返回顶部 返回列表