【2022BI数据分析大赛】飞猪平台用户行为分析

楼主
我是社区第886234位番薯,欢迎点我头像关注我哦~

一、选手简介

1、选手介绍

帆软社区用户名上善若水,混迹于批发零售行业六七年,跑过业务带过班,目前是电商自由职业者,个人比较喜欢数据分析,今后也立志往这方面发展,希望通过这次大赛能检验自己的数据分析能力,查漏补缺,不断进步。

 

2、参赛初衷

  • 希望通过比赛实践提升FineBI的使用方法和技巧。
  • 评估自己的数据分析能力,以便查漏补缺。
  • 和更多FineBI大神交流学习,进行数据可视化作品以及分析思维的激烈碰撞。

 

二、作品介绍

1、业务背景

飞猪,作为中国广受欢迎的在线旅游平台之一,凭借着提供多样性旅游产品,沉淀了用户长期的在线行为数据。五一黄金周往往是用户旅行的活跃时段之一。本项目试图通过对2021年黄金周前后飞猪平台用户行为数据的解读分析,探寻用户其间的在线行为规律,以此来洞察隐藏在用户各个行为背后的寓意,从而为平台运营提供参考依据。因节选的数据集统计周期短,所以在分析中产生的结论还需其他样本集的进一步论证。

 

2、数据来源

数据来源阿里云天池:User Behavior Data from Fliggy Trip Platform for Recommendation

本项目基于分析目的,用户行为数据筛选其中2021/04/15-2021/05/15期间的行为记录。

 

3、分析思路

飞猪平台用户的行为主要包括clk浏览、fav收藏、cart加购和pay购买。其中“购买”是一笔订单完成的重要标志,也是平台运营的终极目标。因此本项目依据统计周期用户的购买频次将用户划分为“兴趣用户”(指从未购买的用户)和“购买用户”(仅购买过一次的用户)和“忠诚用户”(有复购行为的用户),再基于分组对用户做进一步的分析,为什么兴趣用户没购买?什么原因造成首购用户流失?忠诚用户有哪些特征?具体分析思路见下:

用户-场景-问题-当前解决方法 (2)

 

4、数据处理

(1)通过SQL语句筛选取子集、字段重命名、删除重复值、数据一致化、异常值检查等加工及清洗数据;(2)源数据已脱敏;(3)整理各表之间的关联(4)建立自助数据集:

(a)通过左合并功能将三张csv格式表格合并成一张宽表,后续操作都以此表为基础。

(b)过滤行为类型为pay的用户,筛选出所有购买行为的用户,再按用户ID等字段分组去重,购买频次统计求和汇总,过滤(购买频次=1)筛选出“首购用户”名单,按此思路再过滤出购买频次大于1)筛选出“忠诚用户”名单,并分别新增列用户类型赋值“首购用户”“忠诚用户”。

(c)首购用户表上下合并忠诚用户表得到所有购买行为的用户。

(d)将宽表和所有购买用户取差集得到兴趣用户行为表,将其按用户ID分组汇总去重得到兴趣用户名单,新增列“用户类型”赋值“兴趣用户”。

(e)将三类已赋值用户类型的用户名单上下合并得到全部已赋值用户类型的用户名单,右合并宽表,得到全部用户行为分析表,新增列“计数”并赋值1,以便后续分析时统计。

(f)行为类型转化分析数据集制作:全部用户行为分析表选字段用户类型,用户ID,商品ID,行为类型和时间,按用户类型,用户ID,商品ID,行为类型分组,最早时间汇总,新增列“行为”,按“用户ID+商品ID”组内字符串拼接“行为类型”赋值,按字段用户类型,“行为”分组去重,汇总“用户ID”去重计数便得到各个类型用户各行为组合的人数统计。

(g)选取全部用户行为分析表相关字段,按商品类目,商品ID,旅行目的地分组,用户ID去重计数汇总制作用户偏好分析数据集。

 

5、可视化报告

(1)报告框架

图示, 文本

描述已自动生成

(2)图表选择

可视化图表结构简析

(3)样式选择

报告选取了FineBI内置的仪表板样式(复古风格),以深色调为主,概括性指标的图标也选取的蓝色色调,文字组件白色,图表说明深蓝色。

(4)报告内容

  1. 分析背景及目的、数据来源及分析思路电脑萤幕的截图

描述已自动生成
  2. 数据概括性指标及用户分组图形用户界面

描述已自动生成
  3.  

屏幕上有字

描述已自动生成

概括性指标:用大号字及与深色背景鲜明对比的白色,用图片组件配上对应的图标,使其一目了然。

漏斗图:通过漏斗图反应各分类用户的占比及各行为环节的转化情况。

图表分析结论:

文本

描述已自动生成

 

兴趣用户未购买商品的原因(假设检验分析法)

(1)提出假设

(2)收集证据

条形图:对比兴趣用户单一行为和组合行为的人数占比情况

柱形图:对比兴趣用户各行为组合的组内占比情况。

散点图:反应兴趣用户浏览的单品和品类间的相关性。反应平台单品销售次数和品类间的关系。

屏幕上有字

描述已自动生成

图形用户界面, 应用程序

描述已自动生成

(3)得出结论

 

用假设检验分析法分析首购用户未复购的原因

(1)提出假设:假设这些用户是平台新用户

(2)收集证据

柱形图:反应每日平台首次活跃用户的人数对比情况。

图形用户界面, 应用程序

描述已自动生成

(3)得出结论

 

忠诚用户特征

圆环图:反应忠诚用户各性别的占比

柱形图:忠诚用户排名前5的职业情况、居住地情况和旅行目的地偏好对比。

柱形折线组合图:反应随着时间的变化,日访客数和行为总数的变化趋势

树形图:反应忠诚用户关注度最高的5类商品及相应类目下的单品TOP5。

明细表:忠诚用户的基础特征、购买频次统计以及距今消费的时间差。

图形用户界面

中度可信度描述已自动生成

电子设备的屏幕

低可信度描述已自动生成

图形用户界面

描述已自动生成

图表, 树状图

描述已自动生成

图形用户界面, 应用程序

描述已自动生成

图表分析结论:

 

分析结论及建议

文本

描述已自动生成

 

完整版报告效果图

图形用户界面, 应用程序

描述已自动生成

分享扩散:

沙发
发表于 2022-5-13 22:45:28
很好的分析思路,虽然不是企业数据,从多个角度分析了会员,性别、职业、住址、时间等,组件的话还有提升空间,如果随后多做些仪表板估计会有更多收获,可以尝试分析模型,分析结论机建议都不错,谢谢分享
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

板凳
发表于 2022-5-14 09:57:23
整体很不错,交流几点个人看法:
1、【各类用户漏斗结构图】排序好像有点问题呢,应该是首购用户再到忠诚用户;
2、【行为漏斗图】取了“浏览→收藏→购买”,感觉不太合理,收藏应该不是购买前的必要动作,
看了整体分析,对于1和2两个漏斗图,是不是也可以考虑下面两个路径
--用户结构:活跃用户→兴趣用户(有加购行为)→首购用户→复购用户
--用户行为:浏览→立即购买/加购→提交订单→支付成功
2、全文其他维度指标都是中文,四大行为可以考虑换成中文表达
3、如果收藏不是购买的必要前提,收藏/加购行为应该分开分析,会更合理吧..
以上仅为个人拙见
参与人数 +1 F币 +6 理由
帆软苏茜 + 6 有效打卡奖励

查看全部评分

地板
发表于 2022-5-14 21:10:43
分析流程比较完整,认同2楼关于行为漏斗图的使用细节,对于非必要的流程环节可单独列出来做分析,收藏行为可按消费周期与复购率进行关联分析,这样分析会更有意义些
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

5楼
发表于 2022-5-17 15:11:22
案例打卡: 报告设计的很不错,从开源数据集中分析在线旅游平台用户行为特征,建议报告中部分的图表设计调整下会更合理。
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

6楼
发表于 2022-5-20 22:00:09
案例打卡:整体是个不错的作品,图表的主题颜色比较暗,看不太清,调整一下就更好了。
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

5回帖数 1关注人数 11839浏览人数
最后回复于:2022-5-21 22:08

返回顶部 返回列表