1.选手简介
1.1.选手介绍
· 帆软社区用户名:azero,一个喜欢瞎折腾的、刚入门的新手、BI开发工程师。
· 某企业大数据技术组成员,主要做数据开发,BI也是其中一项。
1.2.参赛初衷
· 获奖不是目标,来参赛主要是练练手
· 希望了解更多不同行业的业务知识
· 希望多操作,熟悉BI
· 学习一下其他小伙伴分析问题的角度或特殊的脑洞,完善自己的思维逻辑性
· 我从来不是为了奖励,本人只爱学习
· 当然,能有奖励那就更好了
2.场景介绍
· 天气与我们的生活息息相关,它影响着我们的穿着、出行方式及出门必带的物件。本次分析主要汇总了北上广深四座城市的历史天气,展示不同地区的天气差别。
2.1.业务背景介绍&数据来源
· 简述业务背景:
作为一线城市,快速发展,其天气是否有所变化?天气影响着人们日常生活的出行、穿着。分析北上广深这四座城市的天气差异。
· 简述需求背景:
天气预报能很好的为我们的出行方式、穿着、所带物件的是什么给一定的建议,本次可视化针对一线城市天气分析,分析天气差异,坏天气的元凶。
· 数据来源:
2.2.分析思路
· 先对数据进行合并,并进行一定的清洗。
· 再将其分为3个小part进行分析:空气质量与风向风力、温度、天气。
①空气质量与风向风力有给维度与指标,可以多方面切入。如考虑空气质量的变化趋势、空气质量与风向风力之间的关系等;
②温度给的是最高温度、最低温度,可以计算其温差,考虑整年温度的变化趋势、最值情况;
③天气给的比较笼统,可以考虑就天气情况出现的频率进行切入,分析其特点,按季度或月份。
· 最后撰写结论。
2.3.数据整理
· 数据整合:拿到手的数据是4个Excel,通过FineBI的上下合并操作,进行合并。
· 数据清洗:日期、风向风力、空气质量指数这三列的数据需要进行一定的拆分。最高温度、最低温度需要去掉单位符号。
· 数据模型建立
用分组汇总的方式,计算每个地区不同空气质量的天数
利用新增列的方式,计算每天不同地区的温差值
2.4.完成分析报告
2.5.总结
· 拖延症本人,最后几天才开始动手。找数据源时考虑了很久,找找换换,直到倒数第二天决定做关于天气的数据可视化展示。也因此拖到了最后一天才开始做,迫于时间和精力草草收尾,还有些想法暂未能加入。
· 配色、排版、美化、边框、字体等因时间不足未能尽如人意。
天气.pdf (1.52 M) |