1.1.选手介绍 帆软社区用户名:城落满芯 职业简介:报表开发工程师,日常的工作主要是报表的开发和运维?那是不可能的。主要做的是大数据相关的工作,数仓建设、模型设计、应用搭建等一系列数据可视化之前的工作。很少会将数据做成成果报告,展现在大众面前。同时也渴望着能用自己的分析方法将数据中的乐趣用有趣的方式表达出来,那么FINEBI就是一个不错的选择。
1.2.参赛初衷 看到大赛宣传的时候,只是想着能为着一个目标而去努力,用已有的知识技能储备去完成一个有趣的数据分析报告。用较为美观的方式展现数据的乐趣。从不断的锻炼和成就中,带动身旁的人对其产生兴趣,那么自己也就成为大师了。
2.作品介绍
2.1.业务背景介绍&数据来源
2.2.分析思路 根据现实生活中的实际经验,分为四个模块、区域分析、时间分析、时段分析、车辆分析。
2.3.数据整理 主要数据处理过程 数据源 | | | | EXCEL | | | | EXCEL | | | | EXCEL | | | | 自助数据集 | | | | 自主数据集 | | | | 自主数据集 | | | | 自主数据集 | | | | 自主数据集 | | | | 自助数据集 | | | | 自助数据集 | | | | 自主数据集 | | | | 自助数据集 | | | |
对数据整合清洗的主要方法 (1)骑行距离计算方法: - <font size="3"><font face="微软雅黑" size="4"><span lang="EN-US" style="font-size:12.0pt;font-family:" 微软雅黑",sans-serif;mso-bidi-font-family:="" 宋体;mso-font-kerning:0pt"="">6371004 * ACOS((SIN(RADIANS(${</span><span style="font-size:12.0pt;font-family:" 微软雅黑",sans-serif;mso-bidi-font-family:="" 宋体;mso-font-kerning:0pt"="">单车数据处理<span lang="EN-US">_</span>转换<span lang="EN-US">_start_location_y}))*SIN(RADIANS(${</span>单车数据处理<span lang="EN-US">_</span>转换<span lang="EN-US">_end_location_y}))+COS(RADIANS(${</span>单车数据处理<span lang="EN-US">_</span>转换<span lang="EN-US">_start_location_y}))*COS(RADIANS(${</span>单车数据处理<span lang="EN-US">_</span>转换<span lang="EN-US">_end_location_y}))*COS(RADIANS(${</span>单车数据处理<span lang="EN-US">_</span>转换<span lang="EN-US">_end_location_x}-${</span>单车数据处理<span lang="EN-US">_</span>转换<span lang="EN-US">_start_location_x}))))</span></span></font></font>
复制代码(2)骑行距离分组
(3)骑行时长分组
(4)单个字段存储多个值切割(单行转多行处理) - <font size="3">indexofarray(SPLIT(${笛卡尔积_track},"#"),${笛卡尔积_序号})</font>
复制代码
(5)经纬度分离: - <font size="3">indexofarray(SPLIT(${笛卡尔积_途径地点},","),1)</font>
复制代码
2.4.完成分析报告
2.4.1关键数据视化图表的制作 (1)单车分布点图
(2)日常行走在路上的人
(3)分时段分析用车情况
(4)象限分析
(5)行进轨迹分析
2.4.2仪表板排版 (1)基础配色设置:设置背景色、设置标题颜色、组件间隙 (2)增加配图美化
最终作品见附件。
2.5.总结
数据分析是一项循序渐进的事务,需要不断的学习,不断的练习,不断地深入了解业务,才能深层次的分析数据,挖掘数据中的奥妙。
分享经验: - 在分析中,可以利用数仓建模的概念理论,将数据统一处理,为后期数据做调整时提供很多便捷性。
- 分模块分析,需要先设计模块及模块内需要分析的指标,避免指标偶合性,分析思路进入瓶颈区。
- 仪表板美化时,需开始时选择好色彩搭配方案,避免后期反复调试增加工作量。
- 分析需要循序渐进,也是探索的过程,没有固定的结论,根据数据所显示的结果,再加上外部社会因素,便可以得出较为合理的结果。
附可视化作品:
|