【2023BI数据分析大赛】基于某服装店销售数据的分析方法应用
团队介绍
1、参赛队伍
①队长,一切都值得。某世界500强医疗板块数据搬运工。擅长电商零售、快时尚、房产建筑、通讯、医疗等行业领域的数据分析,熟练使用帆软各种工具,和帆软接触已多达6年有余。
②成员,王阳阳。某世界500强公司区域高级财务经理,对公司经营、财务管理、预算管理等均有丰富经验,接触帆软3年+,成为不断向身边人安利,推广帆软的一份子。
③成员,Joy。某世界500强财务共享服务中心资金结算部门负责人,拥有丰富的大数据分析、大型团队运营管理、资金业务管控经验。接触帆软3年+,日常使用帆软得心应手,快乐地享受着这个工具带来的工作便利以及效率。
④成员,xxxr。现就职于某世界500强央企,某医疗板块医院信息科高级数据分析师、数据产品经理。擅长电商零售、快时尚、房产建筑领域的数据分析,帆软工具管理员,同时擅长FineReport和FineBI两个工具。
2、参赛初衷
BI佐罗曾说过,数据分析的本质和核心是对比。回头想想,无论咱们平时用折线图做趋势分析,用柱形图做对比分析,用饼图做占比分析,还是四象限、帕累托等各种分析方法,本质依然是对比分析。
数据进行对比,才能突出它的“好”与“坏”、“优”与“劣”,只有对比才赋予了数据真正的意义和灵魂。那么,本作品的种种经典数据分析方法的应用,回归本质是不是也是数据的对比呢?
数据分析方法多种多样,应用场景复杂,“变式”较多。各种方法帆软论坛课程、文档均有讲解,甚至往届很多作品也有专题分析,但相对比较零散。
本作品的主要目的是基于某服装店的销售数据,使用描述统计、假设验证、探索分析、四象限分析、帕累托分析、RFM模型、关联分析(购物篮分析)、目标分析(子弹图)等多种数据分析方法进行数据分析,方便大家通过一篇作品便掌握常用的数据分析方法的原理、应用背景、操作过程等。
摘 要
本作品基于某服装公司佛山某门店2022年3月的销售数据,以公司执行“目标考核”和促进“连带销售”两个销售“制度”为出发点,通过描述统计、假设验证、探索性分析、四象限分析、帕累托分析 RFM模型、关联分析、子弹图等分析方法,发现目标达成问题、产品销售问题和连带销售问题,并提出了适当提升鞋子类产品的销售价格、重视会员管理、挖掘金牛产品和结合支持度、置信度和提升度共同分析促进连带销售等建议。
过程中,利用子弹图和对比分析得出整体目标完成较好,但鞋子类完成不高的结论,并进行了进一步的探索分析和假设验证;利用帕累托分析和四象限图分析发现运动鞋、夹克、卫衣、牛仔裤以及短袖T恤是该门店的主产品且为明星产品,但门店存在缺少金牛产品的问题;利用RFM模型发现该门店不太重视会员的维护管理;利用关联分析,发现了部分较高捆绑销售的产品组合。
关键字:描述统计 假设验证 四象限分析 帕累托 RFM模型 关联分析 子弹图
Abstract
Based on the sales data of a store in Foshan in March 2022, this work takes the company's implementation of the two sales "systems" of "target assessment" and promotion of "associated sales" as the starting point, and through the analysis methods of Through descriptive statistics, hypothesis verification, four-quadrant analysis, Pareto analysis, RFM model, correlation analysis, bullet diagrams and other analytical methods, the company found target achievement problems, product sales problems and associated sales problems, and put forward recommendations such as appropriately raising the sales price of shoes, paying attention to member management, exploring golden calf products, and combining the analysis of the degree of support, confidence and enhancement to promote the associated sales.
During the process, bullet diagrams and comparative analysis were used to conclude that the overall target was well accomplished, but the shoes category was not, and further exploration analysis and hypothesis validation were carried out; Pareto analysis and four-quadrant diagrams were used to find that sneakers, jackets, sweatshirts, jeans and short-sleeved T-shirts were the main products of the store and were star products, but there was a lack of golden calf products in the store; RFM model was used to find that the store did not pay much attention to member maintenance management. Using RFM model, it is found that the store does not pay much attention to the maintenance and management of members; using correlation analysis, it is found that some of the product combinations with higher bundled sales.
Keywords: descriptive statistics, hypothesis validation, four-quadrant analysis, Pareto analysis, RFM model, correlation analysis, bullet diagrams.
一、业务背景
2022年,某服装公司开始对店铺进行目标考核,其中完成80%以上,员工绩效系数为1.1;完成90%以上,员工绩效系数为1.2;超过100%员工绩效系数为1.5;之后每超过10%,绩效系数多加0.2。
为了避免店铺团队中出现“吃大锅饭”的情况出现,促进相互督促进步,公司决定对每个店铺的成员进行业绩晾晒排名。
同时,为了进一步提升公司的整体业绩,店铺开始特别注重连带销售,并对员工的连带销售行为进行10元/单的奖励。
为了更好的执行以上考核、奖励制度,公司总部商品部的数据分析师对每个门店进行了销售数据分析和和问题反馈。(本作品根据其真实的业务背景和脱敏的数据“改编”而成。)
二、数据说明
1、销售明细
销售数据主要包括销售日期、订单号、员工信息、产品信息、顾客信息和价格、销量、金额等字段。该数据本作品主要用于四象限分析、帕累托分析、RFM模型和关联分析。
2、目标数据
目标数据包括类别、目标金额两个字段。本作品结合销售数据利用子弹图对其进行目标达成率展示和探索分析。
三、数据加工
本作品的数据加工过程较为复杂,且步骤过多,篇幅太长,特别是RFM模型和关联分析模型的搭建过程。为不影响评委老师和各位网友阅读本作品关键信息,故采用附件的方式放在作品最后。若感兴趣,可翻到作品最后进行查阅。
以下直接展示子弹图数据集、RFM模型数据集、关联分析数据集的最终加工的结果:
1、子弹图分析数据集
2、RFM模型数据集
3、关联分析数据集
四、分析过程
1、描述统计
(1)分析目的
通过描述统计,特别是平均数和标准差,以及销售金额的分布状态,大致整体掌握门店的销售情况,形成初步的结论,方便后续并对其展开进一步的分析。
(2)方法简介
描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。
描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
其中,集中趋势最具代表的是平均数、中位数,离中趋势最具代表的包括方差、标准差和变异系数。
(3)分析结论
根据统计描述结果,其集中趋势中的指标平均数为351.14元,中位数为310.8元;其离中趋势的指标最小值为19.6元,最大值为1076.2元,极差为1056.6元,标准差为209.91。
由下图可知,该店铺的销售价格主要集中在200-500元之间,共773单。其分布呈现明显的左偏分布。
从其分布和描述统计结果可知,价格的分布呈现偏态形状,较为离散。究其原因,是因为该门店存在部分配套配饰品销售且价格相对较低的原因造成的。
2、目标分析
(1)分析目的
本作品利用子弹图进行目标金额和实际销售的对比,直观展示各个类别产品的达成情况,突出显示未达成目标的类别,以便更进一步的探索分析。
(2)方法简介
子弹图是一个可视化实际与目标完成情况的图表,它的外形很像子弹射出后带出的轨道,所以叫做子弹图。子弹图的外表上有点类似条形图(柱形图),但是信息量比条形图更多。
(上图黑白子弹图为百度百科示例,非本作品组件)
通过子弹图,我们不仅可以看到实际数值的大小与等级,还能与目标值比较(是未达目标、达到目标,还是超过目标)。因此,它经常被用在销售、报表、KPI考核等场景。
(3)分析结论
①结果:通过以上分析表格和子弹图可比较直观的显示,该店铺整体目标达成率较好,达到了94.5%,当月该店铺员工的绩效系数为1.2。其中,服装类的销售目标超过了100%,但配饰销售不达标低于60%,鞋子类的销售目标达成率也只有81%。
②问题:总体目标94.5%,未能完成当月目标考核;装饰品、鞋子类目标达成率较低。
③原因:鞋子类产品过度打折销售,导致门店当月销售目标未能完成。(下文验证)
因为配饰的销售占比较小,且非业绩主要贡献产品。故以下只对鞋子类销售目标不太理想的情况进行深入的探索分析。
3、假设验证(探索分析)
(1)原因假设
总体目标或者鞋子类目标完成率未达成,主要是由于过度打折销售造成的。(据了解,该店铺每个月的鞋子类产品销量比较稳定,故作品只从折扣一个角度进行探索分析)
(2)分析过程
将服装、配饰、鞋子三种品类的打折情况,利用柱形图进行对比分析。其中,折扣的计算公式为:折扣=单价/吊牌价。
(3)分析结论
①验证结论:对比分析显示,鞋子的销售折扣最高(即打折最厉害),为7.5折左右;服装折扣则为8折左右。即,假设“总体目标或者鞋子类目标完成率未达成,主要是由于过度打折销售造成的”成立!
②策略建议:为下个月继续冲击100%的目标达成率,可适当减少折扣活动,或者打折力度可以适当缓缓。而后一个月,再根据需求价格弹性指数来决定是降价促销还是升价的决定。
(4)篇外知识
需求弹性是指市场上消费者对于价格变动的反应程度,而销售收入则是企业售出产品的收益总和,需求弹性和销售收入存在着密切的关系。
当产品的需求弹性较大时,产品价格的变动会引起消费者购买数量的较大波动,即价格上涨消费者购买量下降,价格下降消费者购买量上涨。当企业希望提高销售收入时,若该产品需求弹性较大,那么企业可以适当降价以吸引更多消费者购买,从而通过降价的方式提高销售量和销售收入。反之,当产品的需求弹性较小时,即消费者对产品价格变动不敏感,无论价格如何变化,消费者购买数量变化不大。此时企业想要提高销售收入,涨价对销售量的影响并不大,企业可以通过适当涨价,来获取更多的销售量和销售收入。
需要注意的是,在实际经营过程中,需求弹性经常会随着时间、市场环境、竞争情况等因素而发生改变。企业需要依据实际情况不断调整产品价格策略,以获取更好的销售收益。
4、帕累托分析
(1)分析目的
作品中该分析方法应用的目的是为了抓住重点产品,从众多产品中抓取有限数量以提升门店的整体业绩。
(2)方法简介
帕累托分析,又成二八原则、主次因素分析法,是一种得到广泛应用的统计学分析方法。具体来说,指20%的投入可以产出80%的效果。
(3)分析结论
①结果:从以上数据结果显示,运动鞋、夹克、卫衣、牛仔裤以及短袖T恤是该门店的主产品,其销售贡献率(累计销售占比)超过了80%,其余产品销售不到20%。
②问题:产品之间的销售差距较大,头尾效益较为明显。
③原因:公司产品研发重心偏向运动鞋、夹克、卫衣、牛仔裤以及短袖T恤这些产品,装饰品只是作为连带销售的“添头”,同时受季节因素等影响长袖、外套等销售不明显。
④建议:对运动鞋、夹克、卫衣、牛仔裤以及短袖T恤主产品进行重点管理和陈列。同时,结合上述鞋类的目标达成率较低的现状,建议着重管理鞋子类的销售,并做好库存保障工作,同时要时刻关注市场流行因素和款式的变化,挖掘尾部产品的市场价值。
5、四象限分析
(1)分析目的
作为一种策略分析模型,本作品利用四象限分析法可以使门店使用两个维度分析业务、产品的表现,协助其更好的进行资源分配、问题诊断。
(2)方法简介
四象限分析方法由波士顿矩阵图演变而来。波士顿矩阵法可以用于许多方面,在使用波士顿矩阵法中,企业可将产品按各自的业务增长率和市场占有率纳入不同象限,使企业现有产品组合清晰可知。同时可以对处于不同象限的产品做出不同的经营决策,从而保证产品组合的投资合理性,实现产品及资源分配结构的良性循环。
(3)分析结论
说明:作品用销量占比和销售额占比两个派生指标进行四象限分析,结合波士顿矩阵的思想原理。
①结果:波士顿矩阵图数据结果显示,该门店的运动鞋、夹克、卫衣、牛仔裤以及短袖T恤位于第一象限,是该门店的明星产品,其余为瘦狗产品。
②问题:产品结构不合理,如缺少金牛产品等。
③原因:产品研发、产品设计团队投入力度不足;市场部人员不足,市场流行样板更新缓慢等。
③建议:
针对明星产品,要以提高门店的相对市场占有率为目标,甚至不吝放弃短期收益,以长期收益为目标。四象限分析和帕累托分析的结果和结论一致,验证了作品数据分析结果的准确性。
针对剩余瘦狗产品,建议门店进行适当的清理和撤销某些产品,减轻负担,以便将有限的资源用于收益较高的业务。一个企业必须对其品牌业务进行收放与缩减的调整,以使其投资组合趋于合理。
该门店存在一个较大的问题,缺少短期获利(提高业绩)的金牛产品。加大研发、设计投入,时刻关注市场流行因素,做好当季流行款式的研发。此举目的主要是为了获得短期收益,在短期内尽可能地得到最大限度的现金收入,以便更容易完成公司的绩效考核目标。
6、RFM模型
(1)分析目的
RFM模型较为动态地显示了一个客户的全部轮廓。本作品通过该分析方法的结果,对个性化的沟通和服务提供依据。同时,如果与该客户打交道的时间足够长,也能够较为精确地判断该客户的长期价值(甚至是终身价值),通过改善三项指标的状况,从而为更多的营销决策提供支持。
(2)方法简介
RFM模型是衡量客户价值和客户创造利益能力的重要工具和手段。在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱3项指标来描述该客户的价值状况。并针对不同的客户分类采取不同的营销模式。例如:
①重要价值客户(111):最近消费时间近、消费频次和消费金额都很高,必须是VIP。
②重要保持客户(011):最近消费时间较远,但消费频次和金额都很高,说明这是个一段时间没来的忠诚客户,我们需要主动和他保持联系。
③重要发展客户(101):最近消费时间较近、消费金额高,但频次不高,忠诚度不高,很有潜力的用户,必须重点发展。
④重要挽留客户(001):最近消费时间较远、消费频次不高,但消费金额高的用户,可能是将要流失或者已经要流失的用户,应当给予挽留措施。
(3)分析结论
说明:RFM指标计算过程见附录数据加工部分
①结果:RFM模型结果显示,该门店的重要价值客户和重要保持客户,加起来不到0.4%。但,重要发展客户和重要挽留客户占比较多,应该做好发展和挽留工作。(该作品数据只有2022年3月一个月的数据,所以本专题的RFM模型结论只作为参考)
②问题:重要价值客户和重要保持客户占比太少,客户复购情况不太理想,客户“流失”情况较为严重。
③原因:门店处在禅城中心地段,人流量非常大,故“一次性”游客较多;同时,因为客流量大的原因,该公司(门店)并不太重视会员的维护。
④建议:“吸引一个最近个月前才上门的顾客购买,比吸引一个一年多以前来过的顾客要容易得多”。想要门店能够可持续发展,公司应该有居安思危的策略,要重视会员管理,门店应该与顾客建立长期的关系,而不仅是卖东西会让顾客持续保持往来,要定期进行会员活动,并赢得他们的忠诚度。(哪天人流量没那么多了也不一定,现在门店只是吃了地理位置的红利而已!)
7、购物篮分析
(1)分析目的
从交易数据中,发现不同商品之间的联系,挖掘顾客的购买潜力,调整产品的陈列布局,提高销售连带率,从而促进销售的提升。
(2)方法简介
关联分析的起源是啤酒和尿布的故事。是指通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,即购物篮分析。
购物篮分析主要是为了研究以下几个问题问题:
①找出顾客购买行为的模式,比如用户买了A商品,是否会对B商品产生什么影响?
②不同的用户是否具有不同的购买模式?
③哪些产品应该放在一起捆绑销售?
说明:购物篮分析相关指标计算过程见附录数据加工部分
(3)分析结论
①结果:从以上分析结果可知,在STY1267这款夹克的所有购买顾客中,有59%的顾客也购买了STY1288这款牛仔裤,两者之间具有较强的关联性;除了STY1267和STY1288两个产品外,其他产品的销售关联度普遍不高。
②问题:该门店产品的连带销售情况并不理想。
③原因:连带营销策略不足;不太重视产品的陈列;模特搭配较少;店员服务水平不高。
④建议:在库存满足的情况下,在空间运行的情况下,重视产品的陈列,同时可在店铺橱窗以模特搭配出样展示,促进连带销售,产出更多的业绩,促进考核目标的达成。另外,应该重视买一送一等连带销售的促销活动,以及提高门店成员的服务水平让客户产生信任等。
需要指出的是,并不是所有的关联都是有效的。有时候产品A和产品B完成出现相同的顾客购物篮中,可能由于只有一个顾客购买了这两个产品,基数太小导致不具有参考价值。因此,在分析过程中,一定要结合支持度、置信度和提升度一起来分析。
8、其他分析
从上图可知,员工SS0036当月销售额排名最后,且销售额不到第一名的1/10之一。其原因是因为SS0036为新员工,刚培训完调到该店铺帮忙。
差距太过明显,不利于团队和谐发展。
老员工应做好帮带活动,并“分享”部分个人业绩,提升其个人信心,早日发挥其个人作用,补齐短板,注重讲究团结共同完成店铺业绩。
五、结论建议
本作品结合“目标考核”和“连带销售”两个制度为出发点,以提高门店业绩和连带率为目的,结合多种数据分析方法得出以下主要结论建议。
研究问题
分析方法
数据结果与结论
建议与改进措施
目标达成
子弹图、假设验证
鞋子折扣较低导致目标达成不理想
加价,根据需求弹性调整
产品销售
帕累托、四象限分析
主产品和明星产品一致,缺少金牛产品
挖掘市场流行金牛产品
会员管理
RFM模型
缺少价值客户,门店不太重视会员管理
重视管理,做好发展挽留
连带销售
购物篮(关联)分析
门店连带销售情况不理想
多指标分析,重视陈列、服务
(此章节为总结性结论,具体可看分析过程)
六、写在最后
1、参赛感言
累并快乐着,4个不知疲倦的家伙,因为队友王阳阳和其老同学聊天,获得了一份具有“灵感”的数据,所以又临时决定组队,“再”弄一份参赛作品。然而灵感是灵感,落地却没那么简单。
首先,RFM模型和购物篮的数据集加工过程,又长又臭。因为分析过程检查发现很多异常数据,所以过程还出现过几次回头修正数据集的情况。
其次,因为作品突出的是用一篇作品来进行多个常见数据分析方法的“串烧”。所以,得参考很多很多的资料,包括书籍、知乎、帆软社区的帮助文档等,再后才转换成通俗的语言以减少读者和评委的理解成本。
最后,很多操作细节只有队友一切都值得才清楚,但因为不在同一个地方办公,所以其中的沟通成本大到无法想象,甚至一度想要放弃了。
作品最后能发表,是基于我们这群人对数据分析(qian)的热爱,对于帆软BI工具的痴迷。虽然DEF函数帮助文档还不完善和全面,虽然新版本的书籍也还没有(这也是我们给帆软提的建议)。但是,通过平时的学习和此次比赛的历练也都掌握得七七八八了。
2、作品亮点
因为临时组队决定创作一篇“不一样”的作品的原因,所以作品可能还有很多瑕疵,但作品最大的亮点最后还是再次强调——通过一篇比赛作品的篇幅,集合了多种常用的数据分析方法。并且,以通俗易懂的短暂篇幅介绍了这些数据分析方法的使用原理和具体应用。
描述统计、假设验证、探索分析、子弹图、帕累托分析、四象限分析、关联分析、购物篮分析、RFM模型等分析方法在大家提交的很多作品中都有应用,但本作品是它们的“串烧”。以业务背景的“目标考核”和“连带销售”为出发点,以各种分析方法为抓手,一步步从不同的角度和方法展开分析,分析过程采用“结果-问题-原因-建议”的分析思路,最后结论建议也回归到“目标考核”和“连带销售”两个出发点。
本作品采用了“描述性数据分析”、“探索性数据分析”和“验证性数据分析”等型式,是多种数据分析报告类型和分析方法的综合应用。同时,为了保持整个仪表板的布局合理、突出核心。放弃了以往一窝蜂的多组件多文字往里面堆的风格,避免了阅读骚扰,直接开门见山、突出重点和核心。
七、作品展示
八、附录
1、参考文献
(1)知乎,https://zhuanlan.zhihu.com/p/556216877 购物篮分析,作者王一晨
(2)清华大学出版社,《数据分析思维之分析方法和业务知识》,作者猴子
(3)电子工业出版社,《写给UI设计师看的数据可视化设计》,作者吴星辰
(4)电子工业出版社,《数据化管理》,作者黄成明
(5)帆软文档,https://help.fanruan.com/finebi/doc-view-703.html?source=4 RFM分析
(6)帆软文档,https://help.fanruan.com/finebi/doc-view-1195.html 购物篮分析
2、数据加工
A.RFM模型
(1)分组汇总
(2)添加指标(新增列):最近一次消费距今(2022年4月1日)的天数
(3)添加指标(新增列):所有用户的消费金额
(4)添加指标(新增列):所有用户的消费总次数
(5)添加指标(新增列):用户平均消费金额
添加指标(新增列):用户平均消费次数
添加指标(新增列):最近一次消费距今平均天数
添加指标(新增列):R、F、M
客户分类
B.购物篮分析
(1)字段设置:选择订单号、货号
(2)左右合并
字段设置
添加字段:购买A的订单数
添加字段:购买B的订单数
添加字段:同时购买A和B的订单数
添加字段:总订单数
添加字段:支持度
添加字段:置信度
添加字段:提升度
过滤
C.模型视图