【2023BI数据分析大赛】挑战用9行数据分析8000字数据报告!
作品选题
在我们的想象当中,数据分析师应该是诸葛亮那样运筹帷幄、指点江山的角色,不管什么物资都应有尽有,可以直接使用,同理,数据分析也应该是什么好用的模型方法都可以来套一遍,基于此做出优秀的数据分析报告,从而通过报告给企业的发展带来价值,最后走上分析师的人生巅峰。
然而,理想很丰满,现实很骨感,实际上呢?我们能得到的数据可能甚为有限,根本没有办法直接拿现成的数据分析模型去套,而是需要根据实际业务进行指标的拆解和分析。
不过,虽然我们能运用到的数据比较少,但如果能够抓住其中关键的几个,就可以延伸出若干个二级指标,再对二级指标进行再一次的拆解和分析,结合有效的分析结论,就能对企业的运营产生不可忽视的作用,具备指导性的意义。进而在这个基础上,我们才能进一步探索更多的可能性。
本次选题,我们选择数据量较小的、某连锁零售超市2010到2018的9行经营数据,意在锻炼业务分析能力,尝试对经营管理指标进行深度的数据分析。
一、选手简介
1.1 选手介绍
团队名称:祝你安康队
队长介绍:
周康美,帆软小白(不过之前有接触类似的BI产品),目前待业中,正在为转行数据分析做准备和苦恼中,毕竟,数据分析思维的形成需要大量的实践,本次项目的完成便是一次很好的机会和很大的挑战。
成员介绍:
刘安骐:帆软资深用户,已获FCP-FineBI认证,在一家主营珠宝直播电商、供应链的公司担任数据分析师,在本项目中主要负责BI的前端展示,和队长共同完成报告制作。
团队组成:
队长和安骐两人在大学时认识,后来发现都在学习数据,平日就经常一起交流Python,SQL等技术,但发现成长速度较慢,想通过比赛来加速成长,遂组队参加了比赛。
1.2 参赛初衷
常言道“实践是检验真理的唯一标准”,所以组队学习是很好的方式,一同探究问题、讨论技术,而更好的方式是项目实战!
我们在讨论技术的过程中,发现成长来的特别慢,仅仅只是简单重复的训练,虽然可以得到一步又一步的深入讨论,但得不到任何来自外界的反馈,随着时间的一点一点流失,学习动力也慢慢跟着在消失......遂组队参加了本次比赛,希望通过比赛练习数据分析思维,深化关于经营管理的指标和分析方法,跳出纸上谈兵的怪圈。
另外,对于FineBI 6.0的操作和技巧并没有很熟悉,想要通过做项目加深BI工具使用的熟练程度,助力成为一名优秀的数据分析师。
二、作品介绍
2.1 业务背景/需求痛点
业务背景
有位名叫“安康”的数据分析师,任职于某零售企业,平时的工作是为管理层整理经营数据,但是只会根据领导要的数据进行整理,而不会从中获取到更多有意义的信息,简称“表哥”。
虽然安康他的数据整理得很准确,但是却完全无法从数据当中提炼出领导想要的对经营有指导意义的信息,领导要什么他就给什么,而不是自发性产出数据,这种状况让他很是苦恼。
让我们来帮帮他吧!他最近准备进行年度报告的制作,希望做的尽可能详尽有价值,好让领导刮目相看。
需求痛点
某零售超市需要进行一年一度的经营分析,目前已经将各门店的数据整合,并展示了近9年的年度数据,需要针对11个指标进行深入的分析。
需要在数据有限的情况下做出一份完整的有建设性意义的年度报告,为企业未来的发展提供策略。
2.2 数据来源
自选数据:来自和鲸社区的美国某连锁零售超市的2010-2018年的经营数据,共9行11列
数据介绍:
总收入=商品销售收入+会员费收入
总成本=商品成本+运营费用+税
商品毛利=商品销售收入-商品成本
净利润=总收入-总成本
全部会员为总会员人数,付费会员是贡献会员费的会员人数
2.3 分析思路
从安康手中拿到这份数据的时候,我和我的小伙伴很是震惊的,总共9*11列的数据,就这么点数据能分析出啥,还想要一份详尽的数据分析报告,简直就是天方夜谭!!
不过,话虽如此,数据分析还得继续做,于是乎尝试换了个角度:既然没有头绪,那就先来套数据分析模型吧!是否可以将数据按照用户群体划分,使用RFM模型来完成呢?然而,想象是美好的,现实是骨感的,第一步就给我们Pass了,因为当前拿到的都是按照年度汇总的数据,并没有具体的商品和用户的信息,此法不通,于是宕机了好几天。
经过几天的宕机之后,我们冷静地思考和分析了数据分析这件事,发现在实际工作的过程中,商业分析的真实情况就是这样的:我们拥有的数据和资源都比较有限。遂转念一想:收入、成本和利润等常规数据指标是企业经营中最核心的数据,那么,是不是就可以以此为切入点,从而抓住数据的核心呢?
但是,如何从这些常规数据中发现其中的奥秘?如何在没有标准答案的情况下自行制定标准?如何基于数据进行准确的陈述并让人信服?这些都是摆在眼前、需要面临的重大考验。
围绕分析主题和已有的数据,我们打算先从整体上对超市的经营情况进行分析,然后根据每个指标对应的关系进行拆解,先总后分,也就是使用的多维度拆解的分析方法。把握北极星指标,也就是针对净利润展开分析。
首先是净利润本身,通过对比不同年份的数据,对公司的整体情况进行评价,了解企业的发展趋势和变化。而净利润=收入-成本,我们再对收入、成本进行多维度的分析,在分析收入的过程中,还对会员数据进行了分析,层层拆解以分析超市的整体盈亏情况,如下图所示。
主要分以下四个部分:
1.总体分析:展示总体的利润、收入以及成本的数据趋势,了解企业的盈亏情况。
2.收入分析:比较总收入、商品销售收入和会员费收入的趋势和占比,了解各类收入的变化情况和贡献比例。
3.成本分析:比较总成本、商品成本、税和运营费用的占比和趋势,了解各类成本的构成比例以及比例的变化趋势。
4.会员分析:分析全部会员人数和付费会员数的趋势,以及会员费及客单价的情况,了解会员结构和贡献比例。
2.4 数据处理
因为两位成员都不在同一个城市,所以我们选用了线上,先将数据源导出为Excel,并在帆软提供的大赛专用帐号中导入Excel,然后制作自助数据集来进行数据处理。
首先,我们先在Excel上进行了行列置换,并对数据的指标和单位进行一个合并展示,便于操作,如下图。
其次,便是对每个版块需要操作的数据进行处理,具体操作步骤如下。
2.4.1 总体分析
在对数据进行总体分析版块,需要对超市的整体发展做一个初步评价,从整体上来看超市的发展状况,因此将净利润、总收入、总成本以及会员费收入这四个关键指标进行了增率计算。即:(本年的数据-上年的数据)/上年的数据。
接着合并本年和去年数据,由于数据集中没有展示上年的数据,故增加一个辅助列,通过公式:去年年份=年份-1来计算去年年份,然后通过左右合并的形式把去年的数据加入数据集当中。
字段设置,为了让今年数据与去年数据作区分,使用字段设置功能对字段作区分。
计算核心指标环比增长率,考虑到第一年的数据为null,遂用if语句将其环比增长率设置为null,防止出现分母为空计算错误的情况。具体公式见下图,并按此方法完成总成本、总收入、净利润的环比计算。
这样我们就完成了经营分析信息的初步整理了,并把这个数据集命名为经营分析数据宽表。
2.4.2 总收入分析
涉及到总收入的数据分别是会员费收入、商品销售,对于分类的展示需要再新建一个数据集,我们使用了Fine BI 6.0的新功能列转行,发现把对应字段名字放到列字段了,并分别给出对应的数值,真的太神奇了,以前在sql上要用case when,完了之后还要用union all上下合并。
还用了条件标签列,把收入和成本的指标分的清清楚楚,最后还计算了每一项的占比。这个分类数据集就做好了,命名为经营分析收支占比表。
2.4.3 总成本分析
总成本由商品成本、运营费用以及税收3大类组成,同上,需要明确各类在总成本中所占的比例,因此先需要计算各类在总收入中所占的比例,这里与收入分析使用同样的数据集。
2.4.4 商品分析
让我们回到一开始做的经营分析数据宽表。我们为商品分析增加一些计算指标吧,作为零售企业,商品的分析尤为重要,商品成本控制很大程度上代表了我们的利润空间,于是我们用商品成本/商品销售收入计算商品成本控制率。
2.4.5 会员分析
最大的收入来源不就来源于我们的会员么,会员分为付费会员和普通会员,注意这里的普通会员并不是不付费,而只是没有给会员费,两者都是提供消费的群体。
首先我们对会员平均消费金额进行计算,等于每一个会员平均购买商品的金额,计算公式是:商品总收入/全部会员数,但是注意这里的单位不同,需要进行转化处理。
即使是只有两个层次的用户,也得进行分层管理和分析!!我们先计算了会员数量的占比,发现每一年基本都是一样一样的,都是55%,推断出付费用户占比基本保持不变。
2.5 可视化报告
经营分析报告可不能太过于花哨,因为都是内部来看以及做决策的,简洁一些即可,所以我们采用了深蓝色作为基础色,点缀橙黄色,每一部分先展示数据图表再展示分析结论,接着我们把可视化报告分为下面几部分。
2.5.1 总体分析
在完成了数据的处理之后,我们将核心的三个指标,也就是利润、收入和成本的增率与原始数据相结合,用于指标卡的制作。
以净利润为例,我们把净利润和环比增长率进行了展示,并根据增长率的正负进行箭头的展示,一目了然。在仪表板内,还对指标卡进行了图标的点缀。
我们进行了组合图的制作,并往后推了一个周期进行预测,展示超市最新一年的成绩以及在过去几年中的发展趋势。
通过观察后得出以下结论:
从总体来看,净利润、总收入基本保持增长趋势,其中
1.净利润从2010年的13.0亿美元增至2018年的31.3亿美元,反映超市的盈利能力较好,经营状况良好,但净利润波动较大,仍需控制好成本,使其趋于稳定;
2.总收入也从2010年的779.5亿美元,增至2018年的1415.7亿美元,几乎翻了一番,说明超市的业务规模扩大,可能占据了相对较大份额。
3.总成本从2010年的766.5亿美元,到2018年的1384.4亿美元,说明超时在发展的同时,其成本也在逐年增高,但增速放缓,说明超市能够有效地控制成本。
2.5.2 总收入分析
但由于两部分数据的总额并不直观,因此需要计算出各自的占比,即对其在2018年占总收入的比例进行计算。同时为了更直观地展示数据,我们将使用饼图来表示这两种收入在总收入中的占比,清楚地看到哪一部分收入占据了主导地位;
我们对两种收入的趋势图通过组合图的形式展示,柱状图展示了每一年的数据,折线图展示了环比增长率,以观察两者的增长趋势。
最后产出堆积图,以查看商品销售收入和会员费收入占比的趋势,因为两者占比总和为1,所以最大值置为1,但是由于商品销售占比实在太大,为了展示波动,我们把最小值设置为0.9,以直观展示在不同时间段内的变化趋势。
同时,注意到商品销售占比较大,而会员费收入占比较小,会导致会员费收入的重要性被忽视,所以需要明确会员费收入的重要性,我们后续将在会员分析和商品分析模块分别对两者进行深度分析。
结论:总收入由商品销售、会员费收入构成
1.商品销售占总收入的98%,会员费收入占比2%,意味着超市的主要盈利来源是其销售的商品,且商品销售一直处于稳步增长的状态,表示超市售卖情况良好;
2.会员费收入虽然仅占比2%,比例并不高,也并非可以忽视,虽然不是总收入的较大贡献角色,但与商品销售保持几乎相同的增长趋势,未来应该着重于提高会员消费力度,以增加会员费收入;
3.会员费收入虽从整体上看份额较小,但其从2010年的16.9亿美元到2018年的31.4亿美元,一直在保持增长的趋势,比较稳定,且自2015年增速较快,如何保持、转化新用户甚至提高会员费收入,会是未来的关键。
2.5.3 总成本分析
通过对2010年到2018年的各类值的计算,得知各类在总收入中的占比情况;
同时,由于税收与运营费用占比较小,需要明确数据的变化趋势,将税收与运营费用相结合,产出折线图,了解税收和运营费用在不同年份之间的趋势变化情况。(商品成本趋势将在商品模块进行展示)
最后,为了更直观地展示商品成本、运营费用和税收之间的关系,使用堆积图来查看三者的占比趋势,可以很清楚地看到三者之间的占比关系。
结论:总成本由商品成本、运营费用、税构成,商品成本所占比重最大,为88%,运营费用次之,占比10.1%,税的占比最小1.1%
1.总成本从2010的766.5亿美元到2018年的1384.4亿美元,有很明显的增长;
2.商品成本由2010年的680.0亿美元到2018年的1231.8亿美元,随着超市的发展,商品成本也在不断增加;
3.运营成本随着超市的发展,虽然增长不是很明显,但也在逐年发生变化;
4.税收虽占比最小,但增速较快,不过自2017年开始下降,说明超市在合理合法的情况下,明显优化了税务结构;
5.虽然运营成本、税收总额相对商品成本较小,但若加以调整,总成本或有所下降。
2.5.4 商品毛利分析
商品毛利是由商品销售和商品成本两部分组成的,且这两部分在逐年不断增加,为了更好地理解两者之间的变化趋势,我们将数据绘制成折线图进行展示。通过观察折线图,可以明显看出商品销售的增长速度要大于商品成本的增长速度;
进一步深入分析,商品毛利是通过商品销售减去商品成本得出的数值。因此,将商品毛利本身的数据也纳入考虑范围,通过将商品毛利的数据以柱状图的方式,可以看到数据本身的变化情况,这种对比可以更加清晰地了解商品销售和商品成本之间的关系以及它们对商品毛利的影响。
值得一说的是,对于商品成本控制率,我们需要对他进行衡量,使用警戒线的功能为该图表设置了两个基线,一个是底线一个是目标线,用于对坏结果预警,对好结果进行评估。
结论:商品毛利 = 商品销售收入-商品成本,随着年份的增长,商品销售收入和商品成本在逐步增长,其中,
1.商品成本从2010年的680.0亿美元,到2018年的1231.8亿美元,但商品销售收入也从726.6亿美元到1384.3亿美元,商品销售收入的增长大于商品成本的变化;
2.商品毛利也在随着时间在日益增长,说明超市除了做好销售以外,也很好地控制了成本。
3.商品成本控制率基本保持持平,证明内部控制成本策略有效,零售行业商品成本占商品收入的85%-95%为佳,还可以实施更多有效的成本控制措施,如选择更加高质廉价的供应商。
2.5.5 会员分析
首先,为了全面理解会员的整体数据情况,我们需要对会员总人数和付费会员的人数分布进行深入了解,为此,我们可以通过绘制柱形图来直观地展示这两种会员类型的人数分布;
其次,针对会员费收入来自于付费会员这一事实,我们可以进一步拆解数据,以便更好地了解单个会员的付费价值。首先需要计算会员费收入与付费会员数之间的比值,这个比值反映了每个付费会员对于会员费收入的贡献程度,可以帮助我们评估付费会员的价值和重要性;
接着,考虑到会员人数数值较大,了解会员人数占比对于超市的发展具有重要意义。通过计算会员人数占比,可以得知哪些类别的会员在总体中占据较大的比例,进而更好地把握市场动向和消费者需求;
最后,为了评估当前会员转化能力并进一步提高超市的盈利能力,我们需要关注非会员转化为会员的情况。通过折线图查看当前的会员转化率变化趋势,我们可以了解到超市吸引新会员的能力以及现有会员的保留情况,从而为超市优化会员政策、提升用户体验和增加销售额提供有力支持。
结论:
1.会员人数与付费会员人数随着年份的变化在增加,说明超市一直在办理会员制活动,通过会员制对用户进行挽留和刺激多次消费;
2.付费会员在会员人数中所占比例约为55%,已超过一半,表示超市的会员福利较好,或存在积分打折、送礼品等服务;
3.但自2011年开始,付费用户占比基本保持不变,会员转化率也处于下跌状态,超市需要加大在会员方面的经营力度。
4.客单价近两年有所提升,建议继续保持优势,如增加产品种类、提高产品质量、优化产品价格、提供更好的服务。
2.5.6 关键结论
1.超市经营表现良好
①净利润、总收入从2010年开始到2018年间,基本保持增长趋势;
②总成本虽也在逐年增高,但增速放缓;
③会员费收入一直在保持增长的趋势,比较稳定,且自2015年增速较快。
2.这个公司值得借鉴
①总收入从2010-2018年,几乎翻了一番,说明超市的业务规模扩大,可能占据了相对较大份额;
②会员费收入虽然仅占比总收入2%,但一直保持稳步增长的状态,且付费会员人数也基本保持总会员人数的55%,超过一半,这表明会员服务较好;
③商品毛利也在随着时间在日益增长,说明超市除了做好商品销售以外,也很好地控制了成本;
④税收虽占比最小,但增速较快,不过自2017年开始下降,说明超市在合理合法的情况下,明显优化了税务结构。
3.一些建议
①2012年开始,会员转化率基本处于下跌状态,需要加大力度对现有用户进行维系并吸引更多新用户加入,可以考虑提升会员福利的质量和多样性,例如定制化产品推荐、专属折扣券等,也可以通过数据分析和用户反馈来了解会员的需求和行为习惯,从而针对性地改进会员服务;
②运营成本、税收在总成本中占比共12.2%,虽份额较小,但也一直处于增长的状态,还需要对运营费用和税收结构进行优化,尽可能降低总成本。
2.5.7 页面呈现
①公共链接:https://bisolutions.fanruan.com/webroot/decision/link/cKl9
②移动端适配
我们还进行了移动端的适配。经营管理分析的用户是公司高层,他们更常见的场景是用手机来查看,如果能够做好移动端适配,能让领导更直观的查看数据情况。
三、参赛总结
3.1 FineBI工具
去年还在用5.1的FineBI,今年参加比赛必须用6.0,发现帆软6.0的新功能真的特别惊艳,不过也有一些地方,无端耗费了好多时间,如下所述。
点赞点:
1.原来很多需要写sql才能实现的功能,或者写复杂公式,现在只需要简单的点选。特别是赋值列,条件标签列这两个功能;
2.方便的进行行转列,列转行,以往需要用case when 语句才能实现,现在可以直接转过来。并且打上标签,无需用if公式,很多的公式都节省了;
3.复制新的组件之后会马上打开组件方便编辑。
吐槽点:
1.发现6.0几个数据集混在一起的时候,字段很容易拖错;
2.在指标卡中无法进行环比的计算,只能一定要按照时间段,不能按照指定的维度进行计算。
数据分析的价值:
新的设计更加符合数据分析的整体流程,可以直接新建一个分析,从数据处理,然后就制作图表等组件,最后再拼起来成为一个报表,数据流向信息最后流向价值。也可以一边做报表,一边回过头增加所需的指标,不需要像原来跳出来去到数据集里面增加好指标之后等待更新,然后再切换回仪表板制作,浪费很多时间。
3.2 参赛总结
刘安骐:
以往我的精力都在应用开发上面,对于数据分析这块确实挺薄弱,真的就只会套模型,而真正学会做数据分析的重点就是需要把重点指标进行拆解和细分,而不是浮于表面有什么数据就套什么模型。如果没有办法提升业务分析能力,很有可能沦为一个无情的取数机器,业务用户说什么指标我就做什么指标,那你作为数据分析师的价值究竟在哪里呢?
通过这次比赛,我真正的通过实战从简单的数据往下面深挖,从一级指标延伸出二级指标,并通过可视化报告展示分析结果。最后就有了9行数据出了这么多详细的分析内容。
感谢大赛导师李和平给予的支持和鼓励,没有他的push,可能还没有下决心写下第一个字,甚至在我出去玩的朋友圈的评论区墙裂批评,感谢我的队友们,还刚接触帆软就被我拉来打比赛,而且我们第一次一起做项目就能配合无间,用好公共账号和文档的协作,在极短的时间内完成了所有步骤。
周康美:
由于平时自己都是在家自学,一边跟课一边实操,但对于项目这块还没有“真正”的上手过,自己内心很感兴趣的同时,也比较发怵,一直卡着进度,所以当安骐邀我参加比赛的时候,第一反应是兴奋,但同时也知道自己欠缺的还非常多,也比较不自信,导致刚拿到数据的时候,面对9行 * 11列的数据,非常苦恼和无奈,头都要炸了,不知道该怎么弄,接着就崩溃了......
好在几天的宕机之后,慢慢开始修复,在不断的自我调整和安骐的鼓励下,终于振作起来,毕竟,解决痛苦的最好方式就是面对它,当开始跟它battle的时候,就没那么痛苦了,接着就是痛并快乐着~
最后也在这个过程中慢慢运用到了之前知道、但还没有真正去实操的理论,比如:如何在数据有限的前提下,拆解和延伸出更多的数据指标,这让我感受到了项目本身带来的快乐,像安骐君常说的:简单重复的训练哪有直接参与一个项目有效!同时也是李和平老师的“宁愿累死自己,也要卷死他人”,让我看到了更多的可能性,也有了更大的信心和动力。只想说,对于数据分析,仅【路漫漫其修远兮】来形容,这条路唯有队友和老师的帮助下,在项目的加持下,才会走的比较快,也比较远。
最后的最后,感谢李和平老师,感谢安骐,感谢帆软数据大赛!