作品选题
- 我觉得我长那么大,去过最多的餐厅可能就是肯德基,没成年前,总是盼着家人带着去吃,现在离家上大学后,基本是想吃就能去经常关顾……然后最近在学习python爬虫,前几天就突发奇想的想用爬虫爬取一下官网门店数据,所以就有了本次作品展示。
一、选手简介
1、选手介绍
- 个人介绍:帆软社区用户名:鲨鱼娃哈哈,目前就读于海南某大学的大数据技术与应用专业,大三狗一枚。个人感兴趣的方向和领域--打游戏、前端开发、JAVA、Python等(最近在低头研究前端开发)。
- 个人照片: 俺不想给
2、参赛初衷
- 专业课有学BI工具,希望通过比赛实践提升BI工具的使用方法和技巧
- 为了大奖(首要)
二、作品介绍
1、业余背景
- 所谓数据可视化,就是数据视觉表现形式的科学技术研究。不管是企业还是个人,对于复杂难懂且体量庞大的数据而言,图表的信息量要大得多。就我自个而言,不管此次基于什么形式的数据分析,都要尽可能让旁人能从中获取相关数据信息。
2、数据来源
- 此次数据基于Python爬虫,爬取了肯德基全国的餐厅(门店)信息,数据存放表名为全国肯德基门店信息表,在通过百度搜索整理出门店菜单信息表,数据存放表名为肯德基门店菜单。
- 代码展示如下:
运行结果:
3、分析思路
- 数据采集
- 数据清洗
- 确定指标
- 通过BI工具对指标进行数据可视化展示
4、数据处理
- 由于爬取的门店信息数据庞大,难免存在许多重复值,中途有用BI工具的自助数据集处理,但只会用笨方法挨个筛选(没有说FineBI不好,是我太笨了),最后怕耽搁时间,后面只能靠点自个学过的知识解决了,代码如下:
最终导入BI:
5、可视化报告
这里主要说明仪表板的几个重要组件
(1)全国门店分布热力图
- 在所拥有的数据指标里,完全具备了分布图所需条件,因此基于高德地图功能,实现分布图展示。
- 为视觉上好看,选取热力色色调
(2)肯德基门店最多的十个城市
- 对全国各城市门店数量进行过滤和排序设计出门店TOP10柱状图
- 配色偏蓝色调,为配合科技感大屏,设计了闪烁动画。
(3)各城市门店提供详细服务雷安图
(4)门店美食词云图
(5)门店总数前十城市占比分析
- 对全国城市门店数量进行过滤,得到前十城市数据,而后进行占比分析,最后拖入相应图形属性框,实现玫瑰图绘制。
- 最后绘制门店总数仪表盘,通过悬浮得到最终图形组件。
(6)门店美食价格TOP20
- 基于门店菜单数据表,对美食进行过滤,选出价格最大的20个美食数据并排序好大小,进行漏斗图绘制
(7)门店美食价格TOP20
- 基于门店菜单价格数据表,对美食进行过滤,选出价格最大的20个美食数据并排序好大小,进行漏斗图绘制
(8)门店美食类型合计
- 基于门店菜单数据表,对美食类型进行统计,最后把拖入相关任务框,绘制柱形图
(9)最终结果呈现的页面
三、参赛总结
1、FineBI工具
个人觉得这个BI工具很好,很棒,可开发性很高,用来做数据分析和可视化爱不释手,比写代码还快,效率高得要死,是个很不错的工具平台。
2、参赛总结
从中感觉一整套数据分析流程下来,自己还有许多缺陷和不足,今后还需好好学习。 |