【2020帆软杯·数据可视化分析】海底捞火锅客户评论分析

楼主
我是社区第973385位番薯,欢迎点我头像关注我哦~

1作品亮点

从海底捞火锅客户评论从侧面分析出海底捞现在的情况,并未来发展提供选择的方式。从客户这一视角推导出海底捞在这几年发展趋势。

2分析思路

3数据来源

数据获取手段及原始数据说明

我们基于Python通过调用BeautifulSoup库获取“大众点评”HTML网页上的标签信息,通过标签中的文本信息,抓取海底捞火锅店的数据。在一条用户评论中,我们可以获得多项数据,例如用餐总评分,口味、环境、服务的评价,用户评论内容、建店时间等。

将抓取的数据存入数组后,调用openyxl库将数组内容写入Excel表中,完成原始数据获取。

原始数据清洗过程说明

原始数据非常粗糙,存在很多无效数据和重复数据,因此我们进行了如下处理。

  1. 首先在表头添加了列名称,并去除重复项。
  2. 删除无效数据,同样我们通过调用openyxl库,根据行缺失单元格内容和空行等,删除改行。
  3. 清洗数据内容,例如单元格中数据为:口味4(非常好),而我们仅需4这个数字,因此我们同样调用openyxl库,通过正则表达式,将除数字以外的内容替换为空,即可将无用内容去除。
  4. 统计数据,对于菜品选择,我们通过对菜品出现次数求和,得到菜品词频
  5. 最终使用数据说明

原始数据源(三张表):海底捞火锅牡丹园店(原始).xlsx;菜品.xlsx;评论与评分.xlsx;

4复现过程(数据加工+数据分析+数据可视化展示)

1、作品排版布局示意图

2、图表生成详细过程描述

(1)海底捞各地门店分布:“各地海底捞门店数”数据表,构建一个区域地图,并对门店数的多少去颜色渐变,并贴上标签。

(2)菜品选择词云:“meal”数据表,构建一个词云,对不同类别区分了不同颜色,对不同数量取不同大小,并展示文本

(3)顾客对海底捞其他服务的需求程度:“对其他需求”数据表,构建一个词云,对不同其他需求区分了不同颜色,对不同数量取不同大小,并展示文本

(4)环境、服务、口味在总分中占比:“海底捞牡丹园(处理”数据表,创建一个雷达折线图,将环境、服务、口味设置为当前维度百分比,总分进行区间分组设置,添加时间。

(5)近年顾客对口味评价分布及评价数:“海底捞牡丹园(处理”数据表,创建一个矩形树图,在大小中设置为多层饼图,记录数设置为大小,口味划分为区间并标记为颜色。

(6)地区不同店铺平均月评论数与建店时间:“对比处理”数据表,创建一个矩形树图,16年评论数设置为大小以作区分,根据店名不同划为不同颜色增强对比。

(7)地区不同店铺2016年总评论数:“对比处理”数据表,创建一个柱形图,横轴为店名,纵轴为2016年评论数,并按照降序排列。

3、作品展示

5总结

海底捞火锅是否在走下坡路?这个问题是否定的,但是高速发展的趋势放缓,问题日益明显。销售源于客户,在大众点评上的客户评论可以从客户的角度来回答这一问题,我们从店铺在全国的分布情况入手,抽出北京该地区来进行演示,发现客户的评论数量从14年至今一直在减少,可以客观的反映出,海底捞的客源处出现问题,多年来越来越多的火锅店兴起(如小牛海记),抢走了海底捞的客源。海底捞未来的竞争加大,需不断创新保持。

分享扩散:

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表