【2022BI数据分析大赛】XX电商平台消费数据分析

楼主
我是社区第1094718位番薯,欢迎点我头像关注我哦~

一、选手简介

1、选手介绍

  • 个人介绍:帆软社区用户名帆软用户HeQ90VyG60,目前从事营销策划工作,现寻求数据分析方向的转型机会,力争找到数据分析师的工作。个人感兴趣的方向和领域-数据分析。

 

2、参赛初衷

  • 希望通过比赛实践提升BI工具的使用方法和技巧
  • 和更多FineBI大神交流学习,进行数据可视化作品以及分析思维的激烈碰撞
  • 大赛奖励很诱人
  • 借助本次项目经历,转型数据分析师。

 

二、作品介绍

1、业务背景/需求痛点

本次数据截取“和鲸社区”中《京东消费数据集》中2018年4月1日至4月5日的数据作为分析对象。

根据对象的业务属性及业务范围可知,此对象属于平台型企业。发展自身平台影响力的同时,需服务店铺方及消费用户方。

这三个方向涉及不同的需求痛点。故分别对平台维度、店铺维度以及用户维度三方面进行了深入的分析。对于平台方来说,用户转化率是需要着重关注的运维指标;对于店铺方来说,订单量与好评数是需要着重关注的运维指标;对于消费用户来说,消费频次与最近消费时间是需要着重关注的运维指标。

 

2、数据来源

  • 自选数据:

https://www.heywhale.com/mw/dataset/62483abae1d37c001704e37a/content

IMG_256

 

3、分析思路

wps

  • 围绕分析主题,拆解了哪些分析方向?

围绕主题拆解了平台维度、店铺维度及用户维度三个方向。

>平台维度:由平台用户转化分析,得出需优化浏览到下单转化的结论,进而引申出各品类推送时段优化。

>店铺维度:展示了店铺好评数排行榜、订单总数及各店铺订单明细,订单明细支持店铺id、品类及品牌三级下钻。同时对店铺订单量进行了帕累托分析,可明显发现少数店铺贡献了大部分的订单量。

>用户维度:对用户的最近一次消费时间及消费频次进行了分析。同时根据每位用户这两项指标与总用户指标的均值进行比较,并赋值评价。将用户分为了重要价值用户-最近消费时间近、消费频次高;重要发展用户-最近消费时间近、消费频次低,忠诚度不高,很有潜力的用户,须重点发展;一般保持用户-最近消费时间远,消费频次高;一般挽留用户-最近消费时间远、消费频次低。

  • 为什么这么拆解?

从这三个维度拆解能够较为全面的覆盖平台的服务群体,平台在着重提升自身影响力的同时,也在为店铺、消费用户提供服务。

  • 是否用了哪些分析模型

本次分析采用了RFM模型、、漏斗模型及TOP分析等

 

4、数据处理

  • 如何使用自助数据集进行数据处理的?遇到了哪些困难,如何解决的?(不一定要每一步都描述详细,挑重点、比较复杂的描述,配上截图,方便评委和读者学习)

本次分析的的自主数据集根据业务需求划分了A、B、C及D四类,分别为A基本表、B平台维度表、C店铺维度表及D用户维度表。

(1)基本表

>基本表1-action表过滤

本次分析共涉及5项源数据表,因源数据表数据过大,就考虑到使用自助数据集进行数据清洗,通过过滤行为时间筛选了2018年4月1日至4月5日的行为数据。同时考虑到后续分析主要面向下单数据,故对type类型进行了过滤,type=2,代表下单的数据。

>基本表2-生成总表

为防止在3个维度不同的分析中,左连接字段不同或过滤方式差异导致各个分析之间数据不同步。我采用先多表所需字段左右合并链接生成总表的方法,规避数据不同步的风险。后面3个维度分析在总表的基础上处理。

(2)平台维度表

>平台维度表1-转化分析准备

转化分析因涉及浏览、下单、评论及关注多项行为阶段,所以无法使用已生成的总表(已过滤只有下单数据),需单独从action源数据表中获取。

首先对tpye类型进行了分类汇总。其次通过新增列的方式对tpye类型的数字进行了重命名并对行为数进行降序排列。最后,新增列准备合并的字段,该数据集就完成了。

>平台维度表2-转化分析正式

用上述方法重新生成一个正式表,通过准备表的“合并列”与正式表“排序”字段作为链接依据,进行左右合并,这样就可以错位作差,计算留存率了。生成正式表如下所示。

>平台维度表3-下单时间分段

首先在生成“基本表-总表”中选取所需字段,新增列‘下单时间小时’对字段action_time中做获取小时的处理,然后新增列‘下单时间分组’根据‘下单时间小时’进行分组赋值。最后分组汇总,计算占比即可。

>店铺维度表1-好评数排行榜

首先在生成“基本表-总表”中选取所需字段,对店铺id进行分组汇总,同时对总评论数和好评数进行计数,即可生成该数据集。

>店铺维度表2-店铺订单数帕累托

首先在生成“基本表-总表”中选取所需字段,对店铺id进行分组汇总,同时对订单编号module_id进行去重计数。新增列‘序号’对module_id进行降序排名,新增列‘分组’对序号进行分组赋值,这样就把所有店铺按订单量排名等店铺数量的分为了10组。最后分组汇总计数即可得到该数据集。

(3)用户维度表

>用户维度表1-RFM模型

首先在生成“基本表-总表”中选取所需字段,对用户id进行分组汇总,同时对action_time进行汇总处理选择最晚时间,重命名为‘最近一次消费时间’,对订单编号module_id进行去重计数,重命名为消费次数。

新增列计算时间差命名为距今小时数,后续即可根据此计算平均小时数,然后用单个用户与平均值比较做赋值评价。大于平均值赋值为1,小于平均值赋值为0。消费频次的计算与赋值评价原理相同。

最后根据距今小时数和下单频次赋值分组即可得到该数据集。

 

5、可视化报告

(可视化报告可按照组件或业务模块为单位进行描述撰写)

(1)数据含义表达和图表排版布局

  • 组件的业务含义及关键指标制作步骤

平台维度包含转化分析及各品类下单时段分析两个组件。其中下单时段分析采用了气泡图的展现形式。气泡图组件可以多维展示数据,气泡的坐标,大小、颜色均能从不同的维度反映用户的消费行为偏好。不同品类的消费用户,具备消费时间的不同偏好。通过各品类的下单时间的集中度分析,确认该品类最优的营销推送时间。其中气泡的不同大小及颜色代表不同的下单时段集中度。

>气泡越大代表该时段下单集中度越高,越适合做营销推送;

 > 绿色代表该时段极为适合营销推送;

 >橙色代表该时段营销推送效果一般;

 >蓝色代表该时段不适合营销推送。

店铺维度订单总数、订单明细、订单量帕累托分析及店铺好评数排行榜4个组件。

其中订单明细表组件可以对三个层级进行钻取数据,每个层级都将对应展示订单数。其中对订单量排名第一的店铺做了皇冠标注。

其中条形图组件可清晰展示各店铺好评数量及排名,针对排名前三的店铺,对条形图做了变色处理。

用户维度采用了RFM模型作为分析依据,因源数据无金额字段,故此处仅进行RF分析。有RF图及RF表两个组件。

分别对每个用户的这两项数据与总用户的平均值做了比较,大于平均值则该项评价为1,小于平均值则该项评价为0。将所有用户根据评价分为了一下四种类型:

  11-重要价值用户:最近消费时间近、消费频次高。

  10-重要发展用户:最近消费时间近、消费频次低,忠诚度不高,很有潜力的用户,须重点发展。

  01-一般保持用户:最近消费时间远,消费频次高。

  00-一般挽留用户:最近消费时间远、消费频次低。

  • 如何排版布局,设置颜色

本次布局采用了星空的作为底色,三个模块并列展示。每个组件采用悬浮的方式置于背景之上,在保证数据展示的同时,不丢失页面的观赏性。

(2)通过分析得出的结论

平台维度:

>通过观察漏斗模型得出浏览数至下单数的转化率仅为7.51%,转化率较差,商品对于用户的匹配度需进一步加强,比如可在不同的时段进行不同品类的推荐,从而提高下单率。

>通过观察下单时段气泡图组件得出不同品类的消费用户,具备消费时间的不同偏好。通过各品类的下单时间的集中度分析,确认该品类最优的营销推送时间。其中气泡的不同大小及颜色代表不同的下单时段集中度。气泡越大代表该时段下单集中度越高,越适合做营销推送; 绿色代表该时段极为适合营销推送;橙色代表该时段营销推送效果一般;蓝色代表该时段不适合营销推送。

店铺维度:

>通过观察店铺订单量的帕累托分析,得出店铺订单量排名占比前10%的店铺,总单量遥遥领先,此类是重点发展维护类。

>通过观察好评数组件的排行榜得出各店铺在4月1日至4月5日期间获得的好评数。通过好评数可以客观的展示店铺经营质量,由图所示4005、3220及10262经营质量最佳。

用户维度:

>通过观察RF图,得出重要发展用户占比高达48.28%,该类群体消费贡献极具潜力,且群体数量庞大,应着重关注该类群体。

  • 这些结论对业务工作及决策产生了什么影响(价值总结)

平台维度对漏斗模型分析得出需优化的环节;对各品类用户下单时间进行分类统计,得出各品类最优营销时间段。

店铺维度对订单量的帕累托分析可得出重点发展维护的商铺;店铺订单的分析,对总体单量,以及各店铺的明细单量进行排名展示,可用作店铺销售单量的督促;店铺好评数分析,对各店铺的好评数进行排名展示,可用作店铺服务质量的督促。

用户维度对RF的分析,可对用户群体进行划分,得出需着重关注的群体,可作为精细化营销的参考依据。

(3)公共链接分享仪表板

https://bisolutions.fanruan.com/webroot/decision/link/9cmO

 

三、参赛总结

1、FineBI工具

  • 简述你对BI工具的看法

网页办公的设计使得凭借账号即可跨设备跨地域轻松办公。

里面内置的问题搜索模块对小白非常友好。

FVD的可视化素材非常的棒,能够轻松的套用并制作出好看的仪表板。

  • 对数据分析的价值的思考

对于消费分析来说,数据分析的本质是发现数据背后的行为规律,通过对行为规律的把握,优化用户的使用体验,同时提高营销资金利用率,提升平台销售量。

 

2、参赛总结

  • 总结谈谈在这个过程中的克服的困难、遇到的人、感恩的事儿、认知新感悟等等,如:

本次参赛非常感谢官方设置的训练营,让我对finebi的使用有了系统化的掌握,在使用的过程中通过内置问题搜索模块能够很快捷的找到解决方案。同时非常感谢大赛的导师,对我遇到的数据处理问题提出了非常好的优化建议。

分享扩散:

沙发
发表于 2022-5-9 11:37:07
案例打卡:其实兴趣不一定非要用于工作,因为工作会一定程度磨消你的兴趣,干好现有工作的基础上,利用闲暇时间做出更好更多的分析辅助你的现有工作也是一个选择。
进入正题,蓝色的底色,abc+rfm模型,数据展示的非常完美,文末也提出了分析后的建议,希望带着这个数据分析的兴趣继续钻研,加油,共同提高。
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

板凳
发表于 2022-5-9 12:28:54
案例打卡:这几天主要看电商的参赛作品,审美疲劳了,各组件的布局与大小协调性可调整一下,向非数分人员致敬.
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

地板
发表于 2022-5-10 15:05:00
案例打卡:我也在用这个数据比赛,可以拓展更多的维度分析哦
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

5楼
发表于 2022-5-10 15:23:48
案例打卡:利用电商数据进行参赛的作品太多啦,烟花缭乱的,报告是完整的,但是相较于其他有闪光点的同类作品而,可能就显的平平无奇了,分析角度、分析维度大多雷同。山外有山人外有人,重在不断学习,提升自己,我们共同进步呀!
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

6楼
发表于 2022-5-11 20:57:06

案例打卡:先向非数分人群表示尊敬,然后开始给一些建议。整体没有核心商业价值,某些图表的使用没有很适配,只能说勉强能看。针对不同维度的拆解还可以,但是后续的建议和想法都有点过于单薄没有更深挖的支撑。闪光点确实相比同类出色作品不是很多,但是值得尊敬,加油~

参与人数 +1 F币 +6 理由
帆软苏茜 + 6 有效打卡奖励

查看全部评分

7楼
发表于 2022-5-12 19:43:19
案例打卡:组件的颜色还可以再调整一下,RFM和帕累托图用的挺好的。
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

8楼
发表于 2022-5-17 18:07:29

案例打卡:分析思路和数据处理的步骤很清晰完整,仪表板的颜色感觉还可以再优化一下。
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

9楼
发表于 2022-5-27 22:35:41
案例打卡:基本的分析内容都有所涵盖,思路完整!小建议在于各品类下单时间段统计的散点气泡图比较难进行一个查看与比较
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

10楼
发表于 2022-5-30 22:01:46
一份不错的作品~分析维度较全面,提个个人看法,下单时段分析换成小时段可能更有策略指导价值,比如到底触达用户时就要选择好时间点哈哈
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

9回帖数 1关注人数 14499浏览人数
最后回复于:2022-5-30 22:01

返回顶部 返回列表