一、选手简介
1、选手介绍
- 个人介绍:帆软社区用户名帆软用户HeQ90VyG60,目前从事营销策划工作,现寻求数据分析方向的转型机会,力争找到数据分析师的工作。个人感兴趣的方向和领域-数据分析。
2、参赛初衷
- 希望通过比赛实践提升BI工具的使用方法和技巧
- 和更多FineBI大神交流学习,进行数据可视化作品以及分析思维的激烈碰撞
- 大赛奖励很诱人
- 借助本次项目经历,转型数据分析师。
二、作品介绍
1、业务背景/需求痛点
本次数据截取“和鲸社区”中《京东消费数据集》中2018年4月1日至4月5日的数据作为分析对象。
根据对象的业务属性及业务范围可知,此对象属于平台型企业。发展自身平台影响力的同时,需服务店铺方及消费用户方。
这三个方向涉及不同的需求痛点。故分别对平台维度、店铺维度以及用户维度三方面进行了深入的分析。对于平台方来说,用户转化率是需要着重关注的运维指标;对于店铺方来说,订单量与好评数是需要着重关注的运维指标;对于消费用户来说,消费频次与最近消费时间是需要着重关注的运维指标。
2、数据来源
https://www.heywhale.com/mw/dataset/62483abae1d37c001704e37a/content
3、分析思路
围绕主题拆解了平台维度、店铺维度及用户维度三个方向。
>平台维度:由平台用户转化分析,得出需优化浏览到下单转化的结论,进而引申出各品类推送时段优化。
>店铺维度:展示了店铺好评数排行榜、订单总数及各店铺订单明细,订单明细支持店铺id、品类及品牌三级下钻。同时对店铺订单量进行了帕累托分析,可明显发现少数店铺贡献了大部分的订单量。
>用户维度:对用户的最近一次消费时间及消费频次进行了分析。同时根据每位用户这两项指标与总用户指标的均值进行比较,并赋值评价。将用户分为了重要价值用户-最近消费时间近、消费频次高;重要发展用户-最近消费时间近、消费频次低,忠诚度不高,很有潜力的用户,须重点发展;一般保持用户-最近消费时间远,消费频次高;一般挽留用户-最近消费时间远、消费频次低。
从这三个维度拆解能够较为全面的覆盖平台的服务群体,平台在着重提升自身影响力的同时,也在为店铺、消费用户提供服务。
本次分析采用了RFM模型、、漏斗模型及TOP分析等
4、数据处理
- 如何使用自助数据集进行数据处理的?遇到了哪些困难,如何解决的?(不一定要每一步都描述详细,挑重点、比较复杂的描述,配上截图,方便评委和读者学习)
本次分析的的自主数据集根据业务需求划分了A、B、C及D四类,分别为A基本表、B平台维度表、C店铺维度表及D用户维度表。
(1)基本表
>基本表1-action表过滤
本次分析共涉及5项源数据表,因源数据表数据过大,就考虑到使用自助数据集进行数据清洗,通过过滤行为时间筛选了2018年4月1日至4月5日的行为数据。同时考虑到后续分析主要面向下单数据,故对type类型进行了过滤,type=2,代表下单的数据。
>基本表2-生成总表
为防止在3个维度不同的分析中,左连接字段不同或过滤方式差异导致各个分析之间数据不同步。我采用先多表所需字段左右合并链接生成总表的方法,规避数据不同步的风险。后面3个维度分析在总表的基础上处理。
(2)平台维度表
>平台维度表1-转化分析准备
转化分析因涉及浏览、下单、评论及关注多项行为阶段,所以无法使用已生成的总表(已过滤只有下单数据),需单独从action源数据表中获取。
首先对tpye类型进行了分类汇总。其次通过新增列的方式对tpye类型的数字进行了重命名并对行为数进行降序排列。最后,新增列准备合并的字段,该数据集就完成了。
>平台维度表2-转化分析正式
用上述方法重新生成一个正式表,通过准备表的“合并列”与正式表“排序”字段作为链接依据,进行左右合并,这样就可以错位作差,计算留存率了。生成正式表如下所示。
>平台维度表3-下单时间分段
首先在生成“基本表-总表”中选取所需字段,新增列‘下单时间小时’对字段action_time中做获取小时的处理,然后新增列‘下单时间分组’根据‘下单时间小时’进行分组赋值。最后分组汇总,计算占比即可。
>店铺维度表1-好评数排行榜
首先在生成“基本表-总表”中选取所需字段,对店铺id进行分组汇总,同时对总评论数和好评数进行计数,即可生成该数据集。
>店铺维度表2-店铺订单数帕累托
首先在生成“基本表-总表”中选取所需字段,对店铺id进行分组汇总,同时对订单编号module_id进行去重计数。新增列‘序号’对module_id进行降序排名,新增列‘分组’对序号进行分组赋值,这样就把所有店铺按订单量排名等店铺数量的分为了10组。最后分组汇总计数即可得到该数据集。
(3)用户维度表
>用户维度表1-RFM模型
首先在生成“基本表-总表”中选取所需字段,对用户id进行分组汇总,同时对action_time进行汇总处理选择最晚时间,重命名为‘最近一次消费时间’,对订单编号module_id进行去重计数,重命名为消费次数。
新增列计算时间差命名为距今小时数,后续即可根据此计算平均小时数,然后用单个用户与平均值比较做赋值评价。大于平均值赋值为1,小于平均值赋值为0。消费频次的计算与赋值评价原理相同。
最后根据距今小时数和下单频次赋值分组即可得到该数据集。
5、可视化报告
(可视化报告可按照组件或业务模块为单位进行描述撰写)
(1)数据含义表达和图表排版布局
平台维度包含转化分析及各品类下单时段分析两个组件。其中下单时段分析采用了气泡图的展现形式。气泡图组件可以多维展示数据,气泡的坐标,大小、颜色均能从不同的维度反映用户的消费行为偏好。不同品类的消费用户,具备消费时间的不同偏好。通过各品类的下单时间的集中度分析,确认该品类最优的营销推送时间。其中气泡的不同大小及颜色代表不同的下单时段集中度。
>气泡越大代表该时段下单集中度越高,越适合做营销推送;
> 绿色代表该时段极为适合营销推送;
>橙色代表该时段营销推送效果一般;
>蓝色代表该时段不适合营销推送。
店铺维度订单总数、订单明细、订单量帕累托分析及店铺好评数排行榜4个组件。
其中订单明细表组件可以对三个层级进行钻取数据,每个层级都将对应展示订单数。其中对订单量排名第一的店铺做了皇冠标注。
其中条形图组件可清晰展示各店铺好评数量及排名,针对排名前三的店铺,对条形图做了变色处理。
用户维度采用了RFM模型作为分析依据,因源数据无金额字段,故此处仅进行RF分析。有RF图及RF表两个组件。
分别对每个用户的这两项数据与总用户的平均值做了比较,大于平均值则该项评价为1,小于平均值则该项评价为0。将所有用户根据评价分为了一下四种类型:
11-重要价值用户:最近消费时间近、消费频次高。
10-重要发展用户:最近消费时间近、消费频次低,忠诚度不高,很有潜力的用户,须重点发展。
01-一般保持用户:最近消费时间远,消费频次高。
00-一般挽留用户:最近消费时间远、消费频次低。
本次布局采用了星空的作为底色,三个模块并列展示。每个组件采用悬浮的方式置于背景之上,在保证数据展示的同时,不丢失页面的观赏性。
(2)通过分析得出的结论
平台维度:
>通过观察漏斗模型得出浏览数至下单数的转化率仅为7.51%,转化率较差,商品对于用户的匹配度需进一步加强,比如可在不同的时段进行不同品类的推荐,从而提高下单率。
>通过观察下单时段气泡图组件得出不同品类的消费用户,具备消费时间的不同偏好。通过各品类的下单时间的集中度分析,确认该品类最优的营销推送时间。其中气泡的不同大小及颜色代表不同的下单时段集中度。气泡越大代表该时段下单集中度越高,越适合做营销推送; 绿色代表该时段极为适合营销推送;橙色代表该时段营销推送效果一般;蓝色代表该时段不适合营销推送。
店铺维度:
>通过观察店铺订单量的帕累托分析,得出店铺订单量排名占比前10%的店铺,总单量遥遥领先,此类是重点发展维护类。
>通过观察好评数组件的排行榜得出各店铺在4月1日至4月5日期间获得的好评数。通过好评数可以客观的展示店铺经营质量,由图所示4005、3220及10262经营质量最佳。
用户维度:
>通过观察RF图,得出重要发展用户占比高达48.28%,该类群体消费贡献极具潜力,且群体数量庞大,应着重关注该类群体。
- 这些结论对业务工作及决策产生了什么影响(价值总结)
平台维度对漏斗模型分析得出需优化的环节;对各品类用户下单时间进行分类统计,得出各品类最优营销时间段。
店铺维度对订单量的帕累托分析可得出重点发展维护的商铺;店铺订单的分析,对总体单量,以及各店铺的明细单量进行排名展示,可用作店铺销售单量的督促;店铺好评数分析,对各店铺的好评数进行排名展示,可用作店铺服务质量的督促。
用户维度对RF的分析,可对用户群体进行划分,得出需着重关注的群体,可作为精细化营销的参考依据。
(3)公共链接分享仪表板
https://bisolutions.fanruan.com/webroot/decision/link/9cmO
三、参赛总结
1、FineBI工具
网页办公的设计使得凭借账号即可跨设备跨地域轻松办公。
里面内置的问题搜索模块对小白非常友好。
FVD的可视化素材非常的棒,能够轻松的套用并制作出好看的仪表板。
对于消费分析来说,数据分析的本质是发现数据背后的行为规律,通过对行为规律的把握,优化用户的使用体验,同时提高营销资金利用率,提升平台销售量。
2、参赛总结
- 总结谈谈在这个过程中的克服的困难、遇到的人、感恩的事儿、认知新感悟等等,如:
本次参赛非常感谢官方设置的训练营,让我对finebi的使用有了系统化的掌握,在使用的过程中通过内置问题搜索模块能够很快捷的找到解决方案。同时非常感谢大赛的导师,对我遇到的数据处理问题提出了非常好的优化建议。 |