【2022BI数据分析大赛】母婴童行业之新零售连带消费分析
经常有小伙伴问数据集,放在这个链接了,有需要的自取呢哈哈
https://pst1ktjfek.feishu.cn/file/NNEmbiFNAogS95xKiSgcGlRtnX0?from=from_copylink
文中提到的几个配色
一、选手简介
1. 选手介绍
哈喽,大家好呀~我在帆软社区叫“简小凡”.
目前就职于南京一家产业互联网公司,我司目前旨在帮助母婴童产业提升全渠道数字化的会员经营能力,通过对本地化的会员和商品的大数据分析,接入多元化的上游品牌商,为母婴童门店提供母婴商品、亲子服务、新家庭等全品类精选商品和服务,提升整个产业链效率。
本人现阶段主要从事数据分析工作,偶尔会兼做数据产品经理,对产品方向的应用颇有兴趣。
日常喜欢撸猫,这是我家猫咪李橘花的丑照
2. 参赛初衷
2020年秋第一次接触FineBI,至今已在FineBI打怪升级道路上一年半多,算是个有点经验的老玩家了吧,哈哈~想着可以通过比赛评估下自己当前的水平如何;同时也希望跳出日常工作的需求,去做下自己有想法但一直没有落地的分析场景。
再者,去年就有关注帆软的BI数分比赛,了解到这个比赛有很多很优秀的小伙伴,不管是可视化创意、分析思路、数据处理、应用场景方面,很多作品都值得好好学习总结、提炼,并最终运用到自己的工作中去。
总而言之,希望借此机会学习优秀作品的思路、可视化,提示自己的数分思维;也希望自己可以做出一个相对满意的小作品,算是对自己使用FineBI的一个阶段小结吧!
二、作品介绍
▮ 写在前面
选题:零售行业之《母婴童行业·新零售连带消费分析》
我司定位于打造母婴童互联网产业,从上游品牌方、供应商,到下游母婴连锁店,乃至终端消费者,各环节都有数据分析需求。最初思考选题时,有三个方向:
(1)上游:新合作某一品牌系列,要找到该品牌系列在我们的客户范围内的机会点有多大,以及如何说服品牌方与我们合作
——放弃,看板已经做过并应用,至多在美化和思路上进行优化,对自我提升帮助不大。
(2)下游:线上新零售引流到店二次消费,对下游母婴连锁店的业绩贡献有多大
——采纳,连带消费分析陆续做个几次小分析,没有形成完整的分析框架,正好借此机会梳理!做好还能反向应用到工作中,美滋滋。
(3)自身:经营分析体系搭建,从整体的经营监测分析到各业务线核心分析看板的串联,提供核心经营指标监测,并基于核心业务线的核心指标做二级看板跳转,实现可运营的BI数据分析。
——放弃,后续还是要做的,但是工作量有点大了,最近工作上需求不少,我这个DDL选手怕是完不成
1. 业务背景
1.1 背景介绍
在消费升级、群体需求变化、疫情影响等多重因素的驱动下,实体母婴店接受外部赋能,融入新零售发展的大潮成为了必选出路。在新零售模式下,母婴店依托小程序与多场景的有效融合,结合线上运营策略引流到线下,促成会员转化、提高会员复购率,盘活经营效率。
但不同于天猫、蜜芽等线上渠道,"线上零售场"是母婴店与用户的新触点,不能完全取代线下门店的体验消费,在数据上表现为线上零售额远不及线下门店销售,对母婴店而言,通过新零售为线下引流,促成用户“到店二次消费”更能提升门店业绩。在此背景下,我们的客户运营部不定期会给客户提供新零售运营方案,帮助客户提升业绩。
1.2 需求痛点
每次出运营方案都要耗费大量人力、时间从客户系统导出数据进行分析,而客户遍布全国各地,由于区域差异性导致方案复用性较低,客户运营部希望我们数据分析团队可以提供一个固化报表,帮助他们提升工作效率。
1.3 分析问题
进一步沟通后,了解到运营方案差异在于为客户目标客群选取合适商品,通过新零售工具组合拳触达会员,促成转化;同时选品时会和品牌营销部一起沟通,匹配上游合作品牌资源,反向思考后,当品牌要投放资源,本报表可以为其匹配合适区域/客群/场景。
为此,本次报告的分析问题主要有:
(1)了解现状:线上到线下的消费转化率,到店连带消费对门店业绩的贡献度
(2)分析现状:哪些场景、哪些商品、哪些客群的到店连带消费效果最好?
(3)策略选择:对于不同客户如何选择客群+场景+商品?对于不同商品又应如何选择?
2. 分析框架
需求方:客户运营部、品牌营销部
使用场景:
(1)场景一:提供新零售连带消费整体数据概览
(2)场景二:平台级活动或品牌资源投放,选取合适区域/客户群
(3)场景三:赋能单个客户,提供新零售运营方案
分析方法:
(1)整体思路:基于5W2H结合”人-货-场”分析思路对上述三个问题进行拆解
(2)描述现状:通过公式拆解找到本次分析的核心指标
(3)分析现状:对“人-货-场”三个主题逐步拆解,具体方法包括——
对比分析法:看数据整体大小、时间趋势变化,不同维度对比
漏斗模型:看人群转化
ABC分析:找核心枚举
波士顿矩阵分析:找到可选项(城市、商品)
品类关联分析(参照购物篮分析系数):找到商品组合
TOP分析:找到头部品牌
具体分析框架见下图:
3. 数据处理
3.1 数据来源
本次比赛选择的是企业数据,已经脱敏处理,根据分析框架,梳理出所需数据包含:订单、流量、会员、微信场景、城市等级这5部分数据。
3.2 指标口径
指标名称
统计口径
线上消费会员数
统计周期内,订单支付成功的会员数(减退单)
到店核销会员数
统计周期内,订单支付成功后到线下门店核销的会员数,注意按支付日统计
连带消费会员数
统计周期内,到店核销当日产生线下订单的会员数,注意按支付日统计
线上销售金额
统计周期内,订单支付成功的金额(减退单)
到店核销金额
统计周期内,订单支付成功后到线下门店核销的金额,注意按支付日统计
连带消费金额
统计周期内,到店核销当日产生线下订单的支付金额,注意按支付日统计
到店核销转化率
=到店核销会员数/线上消费会员数
连带消费转化率
=连带消费会员数/到店核销会员数
到店人群转化率
=连带消费会员数/线上消费会员数
连带消费贡献度
连带消费金额/到店消费人群核销金额
单客产值
=消费金额/消费会员数
支持度
=A+B同时购买订单数/所有订单数
置信度
=B订单数/A订单数
贡献度
=支持度/A的支持度*B支持度
页面访问量
统计周期内,小程序的页面访问量
支付核销天数差
线上订单核销日期-支付日期,0表示线上支付当天到线下核销
3.3 处理逻辑
本次分析的数据表处理逻辑见下图
具体各部分处理如下
(1) 基础表-订单商品明细数据处理
连带消费本文定位回顾:线上订单到线下核销后当天产生的订单
场景一:支付当日到线下核销并产生连带消费订单;
场景二:支付后N日到线下核销并产生连带消费订单。
存在问题:线上支付订单和连带消费订单是N对N的关系,由于本次分析产出的看板需要支持自定义时间查询,因此需对订单商品行的金额数据进行均摊处理。
数据处理:
① 获取前置订单及核销日期(即表1线上订单),然后获取关联订单(即表2核销日期线下订单)
② 生成表3,获取表1和表2订单重复次数,表1和表2 关联规则为“表1.核销日期=表2.支付日期 且 表2.支付时间>表1.核销时间”
③ 均摊表1和表2的订单支付金额,解决在看板侧计算时的订单重复问题
前置订单支付金额均摊=前置订单支付金额/前置订单重复次数
关联订单支付金额均摊=关联订单支付金额/关联订单重复次数
具体处理见图示,订单数据同时将会员属性和客户属性信息一起通过SQL处理完成后导出到EXCEL,再上传到FineBI
(2) 漏斗数据处理
① 从订单表获取每日会员明细后分组汇总,减少数据量;
② 按“线上消费-到店核销-连带消费”三个环节依次合并“每日会员明细表”:
选择字段,生成环节A”线上消费“;
上下合并“每日会员明细表”,生成环节B”到店核销”字段;环节C操作类似;
③ 合并上述3个环节,生成”消费阶段“字段,并过滤环节为空的数据。
(3) 品类关联分析数据处理
具体步骤参照FineBI帮助文档的购物篮分析:https://help.fanruan.com/finebi/doc-view-1195.html
连带分析的商品组合效果,分两部分处理:
第一,“波士顿矩阵分析”,看不同商品组合的到店人群转化率和连带消费贡献度;
第二,“购物篮分析”,将线上订单和连带的线下订单作为一个整体,挖掘两者之间的联系。
本文旨在了解线上订单引流到店消费的连带效果,因此以前置的线上订单作为主订单号,前置+连带订单的商品视为一笔订单处理(注意连带订单号要非空),具体处理如下:
① 支持度
含义:A+B在所有订单出现的概率,支持度越大,关联规则越重要。
实例说明:前置订单一共10笔(前置订单数=所有订单数),其中同时购买奶粉和尿裤的订单是5笔,则该组合的支持度为5/10=50%8
② 置信度:
含义:购买A后购买B的概率,置信度越大,关联规则准确度越高
实例说明:前置订单一共10笔,其中前置订单购买奶粉的订单是8笔,奶粉的连带订单中购买尿裤的订单是5笔,则置信度为5/8=62.5%
注意由于前置订单在于连带订单前,先购买的商品要从前置订单中取
③ 提升度:
含义:先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,是看组合商品被购买的次数是否高于单独商品的购买次数,大于1说明该组合方式有效,小于1则说明无效。
实例说明:前置订单一共10笔,前置买奶粉8笔,连带买尿裤6笔,前置买奶粉且连带买尿裤5笔,则提升度为0.5/(0.8*0.6)=1.04>1
具体可见下图:
前置订单
前置A:奶粉
连带B:尿裤
AB
支持度
置信度
提升度
10
8
6
5
5/10
5/8
0.5/(0.8*0.6)
4. 可视化报告
4.1 原型与图表选择
第一步,结合分析思路去构思每一模块用什么图形表达;
第二步,选择一个合适的仪表板样式,包括配色、组件背景等的预设;日常工作中,我们数分小组每年会出一套视觉方案,在管理系统-外观配置中预设好当年的仪表板样式,方便大家使用;同时通过视觉差异可以也能快速了解这个看板大概的制作年份;
这次比赛可视化评分占比15%,正好今年还没更换主题色为此想了好几套配色方案,在深色和浅色中纠结许久,最终选择了去年自己的一套深色方案!
按照分析思路初步规划原型图和每个模块图表选择、业务含义/目的,如下图.
这里就不敲文案啦,布局的选择主要还是按照“对称”原则去展示,这个是个人偏好;关于布局,我还想着在本次比赛中学习下各位大神们的思路,提升下自己的审美。
By the way,原型图用墨刀画的,但平常工作画原型图,我会倾向在FineB看板中通过文本组件去实现原型图制作。
4.2 图表处理说明
(1) 对于同类型组件(如指标卡),通过在组件编辑界面切换数据集,可以提高效率;
(2) 漏斗图的转化率展示,通过TAB组件将“漏斗图”、“转化率指标卡”合并在一起,解决不好通过数据集处理自定义时段的漏斗筛选转化率
(3) 通过“闪烁”、“警戒线”、“注释”去突出重要信息
(4) 通过标签的“最大、最小值”减少标签元素的视觉干扰
(5) 联动效果处理
首先取消默认联动,然后在整体看板制作完成后,根据每个组件的联系和整体分析思路去调整;例如,看板默认展示1个月数据,希望点击其他组件的维度,可以查看该维度下的“近一年时间趋势”,这个时候就要改动下相关组件的联动关系了,见下图
这里小小吐槽下,对于不同数据集的组件联动,同自定义勾选字段时,总是会自动匹配所有关联字段,但有时候只需要核心1-2个字段关联,就要疯狂点击删除键保留所需字段。(不过不影响可用性,哈哈)
5. 报告解读
看板制作完成,首先保存一份作为日常使用的看板(不存在任何描述性、诊断性分析),用于满足需求方使用;接着,按照本次分析的命题,另存为一份仪表板,然后输出一份报告给到需求方。
5.1 时间选择:2022年六一大促,选择去年同期数据,并与全年数据对比。
5.2 了解现状:线上到线下的消费转化率,到店连带消费对门店业绩的贡献度
【结论】:2021年6月到店人群转化率较低,单客产值较低 , 但由于线上消费会员数较多,该月连带消费规模较高,且连带消费贡献度高于整体水平;
【建议】:需结合去年同时段大促策略、SA客户的会员消费特征找到影响到店核销的可能原因
5.3分析现状:哪些场景、哪些商品、哪些客群的到店连带消费效果最好?
5.3.1场景选择
首先看省份规模,规模大才更有可能提升业绩;其次按省份下钻查看城市占比,结合消费会员规模、到店人群转化率、连带消费贡献度找出各省份的城市名单。
最后,基于城市名单,选择合适门店类型和营销方式、线上场景。
例如,江苏省2021年连带销售规模最大(20%),其中扬州市的核心指标表现较好,1264线上消费会员,转化率18.75%,贡献度17.56%,线上单客产值167元,连带单客产值高达2764元;并且从线上到线下连带消费,整体人群转化率都表现优异。
可考虑选择商场店,通过短视频和社群推送特卖促销活动信息。
参照上述思路,可考虑重点选择以下4个省份(连带消费金额占2021年6月79%)的8个城市进行重点突破:
江苏省(20%):扬州市(商城店+特卖促销+社群&短视频)、徐州市(社群服务店+多人拼团+社群)
湖北省(19%):宜昌市(社群商品店+多人拼团+社群)
河南省(16%):新乡市(社群商品店+多人拼团+社群)、鹤壁市(社区服务店+福利秒杀+直播)
安徽省(13%):滁州市(社区商品的+特卖促销&活动报名+短视频&社群)
四川省(11%):眉山市(商场店+特卖促销+社群&短视频)、达州市(社群服务店+特卖促销+社群)
5.3.2 品类品牌选择
5.3.1已选择出7个城市,该部分重点针对这7个城市,通过数据联动,找到合适的品类品牌;以扬州市为例:
扬州市2021年6月线上玩具车床图书品类消费会员数、线上销售金额均最高,可以在线上主推该品类的华婴地垫品牌,
婴童服饰、辅食、纸尿裤线下购买人数较多,从品类关联角度看,可以考虑婴童洗护+婴童服饰,婴童洗护+零食,婴童服饰+婴童服饰的组合;婴童服饰品牌可选“奇宝乐园”,婴童洗护品牌可选“松达”。
线下3段奶粉、纸尿裤和2段奶粉销售金额占比较大,品牌可选贝因美、妙兜、飞鹤;结合关联分析,婴童洗护和3段奶粉组合搭配相对较好(订单数较大,但是提升度<1)
5.3.3 客群选择
仍以扬州市为例,结合社群和短视频场景效果最好,可以针对女性群体,围绕1-3岁宝宝偏好内容和品类,选择下午17点、20-21点进行推送和触达
考虑到时间影响因素,需要查看当前时间宝宝年龄分布,经查询会员分析看板,扬州市截止2022年4月末,宝宝年龄分布仍以1-3岁为主,因此上述选品相对可行。(我司用户可以从目录/会员综合分析中查询,本次报告不展示该数据,后期会增加看板跳转==)
已转化人群中,男性占比相对较高,当女性仍占绝大部分,女性和男性会员宝宝均已1-3岁为主;
从访问行为看:
--女性会员:偏好17、20-21点查看小程序,其中21点访问量最大,基本使用最近使用访问小程序
--男性会员:偏好9点查看小程序,基本使用最近使用访问小程序
5.3.4 《母婴童行业·新零售连带消费分析》之六月大促如何选品
对于本次六一大促选品,分析结论如下
(1) 2021年6月到店人群转化率较低,单客产值较低 ,但由于线上消费会员数较多,该月连带消费规模较高,且连带消费贡献度高于整体水平;
【建议】:需结合去年同时段大促策略、SA客户的会员消费特征找到影响到店核销的可能原因
(2) 考虑重点选择以下5个省份(连带消费金额占2021年6月79%)的7个城市进行重点突破
① 江苏省(20%):扬州市(商城店+特卖促销+社群&短视频)
② 湖北省(19%):宜昌市(社群商品店+多人拼团+社群)
③ 河南省(16%):新乡市(社群商品店+多人拼团+社群)、鹤壁市(社区服务店+福利秒杀+直播)
④ 安徽省(13%):滁州市(社区商品的+特卖促销&活动报名+短视频&社群)
⑤ 四川省(11%):眉山市(商场店+特卖促销+社群&短视频)、达州市(社群服务店+特卖促销+社群)
(3) 以扬州市为例进行策略选取,其余城市参考思路即可
① 扬州市2021年6月线上玩具车床图书品类消费会员数、线上销售金额均最高,可以在线上主推该品类的华婴地垫品牌;
② 婴童服饰、辅食、纸尿裤线下购买人数较多,从品类关联角度看,可以考虑婴童洗护+婴童服饰,婴童洗护+零食,婴童服饰+婴童服饰的组合;
③ 婴童服饰品牌可选“奇宝乐园”,婴童洗护品牌可选“松达”;
④ 线下3段奶粉、纸尿裤和2段奶粉销售金额占比较大,品牌可选贝因美、妙兜、飞鹤;结合关联分析,婴童洗护和3段奶粉组合搭配相对较好(订单数较大,但是提升度<1) ;
⑤ 结合社群和短视频场景效果最好,可以针对女性群体,围绕1-3岁宝宝偏好内容和品类,选择下午17点、20-21点进行推送和触达。
6. 最终结果
6.1 日常使用版本
6.2 分析报告版本
三、参赛总结
1.FineBI工具
(1) FineBI对于新手而言是非常优化的自助分析工具,易上手、做出来的效果也很美观;对于在企业内部推广自助分析是一个很不错的工具选择(当然不是尬夸啦,我所在公司就在用FineBI啦)
(2) 目前为止最喜欢的几个功能点:切换自助数据集(配合复用,对工作效率提升非常有帮助);Excel插件,这个期待很久了,近期公测使用了该插件,很好弥补了复杂式报表、系统数据和填报数据混杂的场景。
(3) 对于BI工具和数分的思考:FineBI工具要走出IT部门,真正推广到业务部门中去才能更好发挥BI自助分析的价值,不管是提升业务日常数据处理效率,还是让业务进行探索分析,都是很有必要的!
2.参赛总结
总结吧,最主要还是要好好规划时间,不然DDL选手真的就要错过末班车了......认真总结如下:
(1) 想做很久的分析通过比赛落地,很有成就感;同时学习了如何在BI处理关联规则的数据和可视化,颇有收获。
(2) 业务分析框架和思路确定后,缺少和业务深入交流讨论,这点做得是不够的。
(3) 本次看板的联动做得不是很好,这一点提交作品后看看还有没有优化空间。
(4) 数据分析一定要有参考线,不管是自我对比,还是他人对比;在对比时候一定时刻牢记时空变化,群体和群体需求也是在变化的,例如在分析报告版本解读的时候,发现没有增加当前人群画像属性是不够的,碍于时间问题暂未补充该数据,多少有些遗憾。
最后,本次分析从规划—确定选题—拆解思路—原型制作—看板制作整个环节看,确定选题和拆解思路方面感觉自己有些许提升,但是到底如何,还是只能寄希望于最终结果和点评,看看自己几斤几两啦,哈哈~~~但不管如何,这次比赛经历弥足珍贵。
分析报告版本《母婴童行业·新零售连带消费分析》.pdf (1.72 M)日常使用版本《母婴童行业·新零售连带消费分析》.pdf (1.53 M)分析框架《母婴童行业·新零售连带消费分析》.pdf (514.78 K)原型图《母婴童行业·新零售连带消费分析》.pdf (473.87 K)