【2021夏季挑战赛】XX零售企业年度分析报告

你好,我叫戈理秀
一、选手简介

1、选手介绍

团队名称:菜鸟向前冲队

队长介绍:网名奋斗的小青年,目前就职于莱绅通灵,我司是珠宝行业的零售公司;目前从事数据分析岗位,个人感兴趣的领域是数据可视化,数据像一门语言,构图像一门艺术,以艺术去展现语言的美,让读者以欣赏美的心境去获取你想传达的数据信息。
 
成员介绍:
  • 成员1:网名老刘,现就职某互联网公司,从事数据分析多年,对数据挖掘,数据可视化,数据产品这几块颇有兴趣。
  • 成员2:网名Andrew,一直在制造业做质量管理工作,     业余时间学习python,SQL,热爱数据分析,喜欢用数据分析问题
  • 成员3:网名Ivan,目前就职于一家茶业零售公司,从事数据分析岗位,希望通过本次大赛提升自己。
  • 成员4:网名云中鹤,就职于北京某科技公司,我司是科技研发行业的公司,目前从事编程、ETL与项目实施岗位,个人感兴趣的领域是数据分析与可视化。

团队组成:因对数据可视化的兴趣和零售行业的工作背景而相识、相知,并组成了一个团队,共同学习、共同做项目、共同成长
   截图202106302038433362.png

2、参赛初衷

工作中我们大多是螺丝钉的角色,承担整个项目的一个模块,参赛可以让我们跳出工作的局限性,参与项目的整个流程,提升个人分析思维和可视化工具的操作技能。希望和更多的大神交流学习,一起合作来完成一份好的作品,对自身能力的检验,以项目去验证能力的短板,从而去有针对性的提升。想给自己的经历增加一些亮点,也想得到行业里的专业人员的指点,汲取他人所长。

二、作品介绍

1、业务背景/需求痛点

1)业务背景:经历了十几年的信息化高度发展,企业积攒了大量的宝贵数据。如今,中国零售业所面临的最大挑战就是顾客和市场需求复杂多变,比起人的经验主义来做决策,只有实时的数据分析和反馈才能适应更快的变化。零售的本质离不开人、货、场这三个核心,并围绕这三个核心提升运营的效率,也就是线上线下的成功融合,对数据进行收集、整理、分析,最终实现数据驱动业务决策的目的。

2)需求痛点:某零售企业往年未意识到数据分析的重要性,经常以人的经验主义来做决策,导致目标制定不合理、策略不符合业务实际场景。现在领导希望数据分析师可以给出一份完整的年度分析报告,为领导决策提供数据支撑,以便于更科学合理的制定年度目标和策略。

2、数据来源


3、分析思路

经过团队的内部讨论,基于现有的数据进行思维导图搭建,针对各个分析模块点确认对应的可视化图表;整份报告分为整体复盘、用户分析、产品分析、门店分析、总结及建议5个模块。每个模块的分析思路如下:

1)针对企业2020年的整体情况进行复盘,先从整体的营收、利润去了解20年的业绩,再结合地域去看业务覆盖范围,结合用户生命周期看当前用户的健康状态,通过周度销售、利润趋势分析全年的旺季、淡季,最后列示用户、品牌、供应商、门店top榜,后期向优质用户、品牌等给予更多资源倾斜。

2)用户分析,对用户的性别,年龄进行分析,精准了解客户群体和消费能力。对新客户及客户流失分析,了解客户拉新状况,对公司的后续发展前景做深度评估。

3)产品分析,对产品维度进行分析,对各品牌销售情况和不同产品类别销售利润的分析,了解平台畅销品牌、畅销产品等,结合不同的门店对比优化产品线。对产品关联度分析,优化平台促销,捆绑销售方式。


4)门店分析,针对各门店的产品销售情况进行分析,确认各个门店各个产品的经营状况;建立RFM模型,确认各门店的用户价值分类,根据门店的客户分类情况,做好精准营销;

5)就以上结论和现象进行相关改善建议

整体分析思维导图如下所示:

截图202106302039426884.png

4、数据处理

数据内容:基础数据表主要为以下9张,其中生命周期表通过Excel PQ/PP对客户表和订单表处理联合处理得来,主要是对每个员工的首单和末单时间计算,购买次数,购买总金额计算。

表名
中文名
主要内容
类型
电商分析数据2_Store  
门店表
门店信息
基础表
电商分析数据2_region_info
地区表
地区编码信息
基础表
电商分析数据2_product_supplier_info
供应商表
产品供应商信息
基础表
电商分析数据2_product_brand_info
品牌表
产品品牌信息
基础表
电商分析数据2_product_info
产品表
产品信息表
基础表
电商分析数据2_pay_method
支付方式表
客户支付方式信息表
基础表
电商分析数据2_order  
订单表
订单信息
基础表
电商分析数据2_date  
日期
日期信息
基础表
电商分析数据2_customer_inf
客户表
客户信息
基础表

主要用到自助数据集宽表为:订单核心各维度聚合宽表,RFM模型表

整理过程:
第一步:获取:登录和鲸社区,下载数据集
第二步:清洗,为保证数据的准确性,通过EXCEL配合相应函数完成,对数据进行简单去重、异常数据等清洗,这边不做过多叙述。
第三步:导入传入到帆软BI,并为了方便操作,将每张EXCEL表单独创建一张宽表,作为维度表。(方便单表添加字段或维护),为后续制作大宽表打下数据基础。
第四步:主要宽表制作

1) 订单核心各维度聚合宽表

a.以电商分析数据2_order为核心表,链接各维度表,创建订单核心各维度聚合宽表。

b.选取订单核心表,通过左右合并依次和各维度表进行合并。
截图202106302040269022.png

c.新增列计算利润金额
截图202106302040406061.png


d.新增列对年龄段进行分组
截图202106302041014123.png

e.订单核心各维度聚合宽表创建完毕

2) RFM模型表

a.首先复制订单核心各维度聚合宽表
截图202106302041116564.png

b.新增列客户总体消费金额平均值
截图202106302041215632.png

c.分组汇总得出客户总体消费金额、消费频次、最晚消费时间
截图202106302041341524.png

d.新增列最近一次消费距离时间
截图202106302041451951.png

同理新增列可得客户总体消费频次平均值、客户总体最近一次消费距离时间平均值。
a.利用if函数判断可得消费金额向量化、消费频次向量化、最近消费距离时间向量化
截图202106302041553649.png

b.利用CONCATENATE建立RFM
截图202106302042051080.png

c.分组汇总,并对RFM进行定义
截图202106302042158696.png
至此相关数据处理完毕,数据整理告一段落。

5、可视化报告

1)整体框架:依据逻辑思维导图进行整体框架搭建,按背景、复盘分析、用户分析、产品分析、门店分析、总结及建议几个模块进行搭建;


2)图表选择:图表选择可以看这张图,了解下每种图偏向的分析内容。
截图202106302042381894.png


3)分析思路和对应结论

①整体复盘分析:企业关键指标展示,通过周销售趋势图及环比,还有各省金额分布分析了解平台销售走势和销售分布,企业当前用户的生命状态,了解平台销售状态整体了解及门店、产品品牌、客户、供应商的销售状况。

截图202106302042545984.png

结论:
a.发现2020年的销售金额和利润金额整体比较平稳,但在45(11月)周之后连续四周,有一个突然上升的过程,趋向平稳。之后趋向正常。
b.了解销售额最多在广东,销售额占24.59%,其次为江苏(11.45%)和重庆(10.48%)。
c.对客户生命状态进行分析,平台老客户占绝大多数,占71.24%,说明客户的忠诚度较高,新客户6.95%,说明客户拉新不足,需要进行改善。

②用户分析:通过对客户性别,年龄结构以及帕累托分析品类销售情况,了解客户的群体划分,有利于了解平台产品的消费人群,更好的精准销售,对新客户流入随时间进行分析,了解平台拉新状况。

截图202106302043068701.png

结论:
a.发现客户64%为男性,70%客户群体在25-30之间,25-30岁的男性为平台主要消费客户,对以后的拉新目标提供依据。
b.客户支付方式70%以上为支付宝,信用卡和微信。
c.通过对客户年龄矩阵分析,发现25-30岁为主要消费贡献,但其客单价位列最末,仅为11423,有很大的提升空间。而35岁以上只有44人,但利润率最高,说明其消费潜力巨大,可能需要为这类人群提供更适合的产品。
d.新客户增长趋势图,能看出优惠促销活动能很好的促进拉新,销售,对销售额的提升有重大影响,以后需要研究讨论定期开展此类活动。

③产品分析:对产品按品牌,不同种类进行分析,以得到销售额,利润额最好的产品。结合不同门店不同产品的热力图,可知畅销款有哪些。通过产品关联分析,有利于相关产品做捆绑销售,采取更有效的营销手段。

截图202106302043182855.png

其中【产品类别一销售情况】通过跳转,可定该类别底下,各门店,各用户,各品类的销售情况,可实际了解产品在其他维度的销售情况;

截图202106302043264247.png

下面是品牌热心图和产品关联支持度图:
截图202106302043337897.png
截图202106302043469763.png

结论:
a.从品牌来看,骆驼牌销量最好,但利润率最低;Jack Wolfskin利润率最高,但销量居中;17个品牌中11个品牌的利润率超过12.68%;  
b.按产品一级分类看,女士的销售额占比48.9%,而利润率仅有11.61%;户外产品利润率达18.12%,但其销售金额占比仅有19.2%;  
c.按产品二级分类看,女士上装、男士上装、女士下装销售居前三;但女士上装和男士上装的利润率均不超过10%;利润率最高的为男士下装和户外装备,达到18.39%;  
d.按产品三级分类看,毛衣、风衣、夹克、外套、雪纺衫五类为企业的主要销售产品,但五类商品的利润率均低于10%,可适时减少五类商品的优惠力度;  
e.按品牌在各门店的销售热力图看,骆驼、Lee、李宁三个品牌为各门店的主要热销品牌;  
f.按产品品关联分析来看,购买风衣的用户加购休闲裤的概率达86.93%;购买衬衫的用户加购休闲裤的概率达85.06%;企业可对产品与产品之间关联度高的做套装进行捆绑销售。  

④门店分析:对平台不同门店的销售额、客户数量、客单价,利润额分析,找出绩效最好的店铺;通过表格与图形之间的联动关系,可了解各门店、产品等维度在各个月份的实际销售情况,定位具体问题。
门店销售情况设置了下钻功能,从一个门店可以下钻到产品类别一、从产品类别一可以下钻到产品类别二、从产品类别二可以下钻到产品类别三,并设置了与门店月份销售数据表的联动,详细的可以看视频介绍的演示。

截图202106302044038712.png

  针对门店用户,建立RFM模型,通过筛选框可具体定位各个门店的用户分类情况、门店用户金额和客单,具体客户的用户分类,流失可能及门店各月份新用户变化情况,针对用户的具体类型进行精准营销。

截图202106302044131944.png

结论:
a.平台门店年度销售额大于1500万有永旺店、岁宝店、天虹店、崇光店,其中永旺店销售额达2042.87万元,客户数2187人,位居榜首。
b.从折扣力度上看,平均折扣在75%~76%之间,但门店折扣几乎相同的情况下,用户数量销售额有很大差异,以麦德龙店和海雅店位居末席,仅为500人,需要做出改善。
c.从利润率来看,各门店利润率差异不大,平均在9000到9600之间,最高的为茂业店。
d.从客单价来看,各门店差异不大,平均在平均在9000到9600之间,而重要价值客户也凭借着自己的高客单,高销量为销售额提供了主要贡献。 最高为沃尔玛。
e.针对各门店的用户分类、用户消费情况、门店每月新客户变化情况,可采购有针对性的销售政策,提升用户留存率、拉新率等。

⑤总结和建议:
a.企业整个年度的销售情况呈稳定增长趋势,其中11月份达到本年度最高销售额,但因促销力度的增加,整体的利润率也仅有9.84%;
b.11月份虽然达到了本年度最高销售额,但是整体的增加新用户数仅有346人,用户增加的效果并不明显;11月份销售额主要的销售收入仍来自于老用户;可结合双十一的复盘报告综合分析,为何新用户数增加的数量没有质的飞跃;
c.企业的销售群体主要针对的是40岁以下的用户群体,尤其是25岁左右的年轻群体,可结合当下流行的时尚趋势,增加一些潮牌产品;
d.男性用户企业占64.65%,但是男装带来的销售额仅占31.91%,可针对当下男装产品进行定位性分析,优化整体男装产品的架构;
e.户外用品为企业的主要盈利点,且其年度平均折扣力度仅有85.36%,但其带来的利润率有18.12%;户外产品数占产品总数37.19%,销售用户男女比例约为2:1,9456人产生了2299.95万元的销售额;
f.各门店可根据客户的采购分类和采购行为采购有策略的销售,例如针对新用户可推送相关优惠券信息,针对高价值用户可推送新产品信息等。

  3)最终结果呈现的页面布局
截图202106302044331135.png
作品视频:


三、参赛总结

1、FineBI工具

1)仪表盘不同用户不同电脑打开,整体布局就会错乱

2)悬浮功能与组件能否绑定,可以不用调整组件位置,悬浮功能也得调整

3)提供绘制的图形偏少,较为复杂图形无法实现

2、参赛总结

在这次比赛中,我们为了共同完成一份报告而聚在一起,每个人对数据分析都有自己的见解。从最初的的分析主题确定,到用哪份数据,先定数据还是先定主题都有过较深层的讨论,每个人在完成作品的过程中都积极的参与、配合。也因为两个人对一个分析思路意见不一有过面红耳赤的激烈讨论,但每个人都是为了做出一份更好的报告。我们的文档最后一天匆匆忙忙写的,格式、内容都没有整理好,有点遗憾。
 
 

发表于 2021-7-2 12:55:49
欢迎大家评论、提建议
发表于 2021-7-2 13:26:42 发布于APP客户端
学习了
发表于 2021-7-2 19:08:42
发表于 2021-7-3 19:25:40 发布于APP客户端
点赞,666
发表于 2021-7-5 09:08:46
不错不错,很棒
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表