【2023BI数据分析大赛】出版社经营情况分析
【2023BI数据分析大赛】出版社经营情况分析
一、选手简介
1.选手简介:
大家好,我是Lauren,帆软社区用户名“LaurenWang”,目前在一家出版企业做数据分析师,由于这3年在企业非常卖力的在推广FineBI的使用,所以人称“行走的Fine BI种草机”。
2.参赛初衷:
从事数据分析7年,2021年对Fine BI“一见钟情”,在企业内部安利了Fine BI三年多,终于在今年年初在领导的支持下,企业开始全员使用Fine BI。所以今年在企业内部有了25位并肩作战的设计用户伙伴,那么组织大家参加Fine BI数据分析大赛那是势在必行呀,经过了两周的动员,有6位小伙伴决定参赛,那人称“行走的Fine BI种草机”的我也得先“参”为敬啊!
二、作品介绍
选题背景:
图书出版行业经过了过去今年从线下向线下快速转移,在保持了近10年的持续高速增长之后,在2021年首次出现了行业大盘的下滑。从整体大环境来说,一方面,由于国家双减政策使得教育出版的供求关系发生了变化,之前课外辅导、课后练习等产品的需求量锐减,使得教辅相关板块出现了大幅下降;另一方面,由于线上渠道趋于饱和,抖音为代表的短视频、直播电商渠道使得马太效应更加显著,很多头部出版社、民营公司的爆款产品快速占领短直渠道,使得其他出版社的腰部产品露出的可能性降低,所以很多出版社都面临一定程度的业绩下滑。
所以,在大环境变化的背景下,对于出版社的精细化运营提出了更高的要求,对企业内部数据进行分析并高效决策成为任何一家出版社的“必修课”。
1.业务背景:
上海某出版公司刚刚召开了半年总结会,销售部门领导在总结上半年的出库情况时表示,目前出库任务与去年同期相比有一定增长,虽然目前时间进度过半出库任务只完成了40.20%,这主要是由于1月份疫情放开对发货产生较大影响,从趋势来看6月同比还有增长,年底一定能完成出库任务。但社长看了一下数据表示:出库数据不能与2022年去做比较,2022年3月、4月上海的库房处于封控状态,发货受到较大影响,如果按目前的情况看出库任务仍有较大缺口,而且退货率也远高于去年。社长看过数据后,觉得整体生产和销售的节奏都有些问题,生产任务也只完成了40.84%,社长对数据分析部门说,针对于今年的出库和生产任务情况做一个详细的分析,找出目前的问题,确保年底能够完成出库和生产两项重要考核任务。分析师Lauren开始对半年的情况着手进行分析。
2.数据来源:
数据来源于某出版社某年的数据脱敏(任意取部分产品明细和销售单据,并乘以随机系数进行脱敏),客户名、书名、业务员名均通过ChatGPT生成了随机名称并进行了替换。
3.分析框架
分析方法:
GROW分析法
GROW分析法多应用与帮助员工成长进而达成绩效,而在企业的经营问题复盘中,也可以通过确认目标,分析现状,提供方案并制定行动计划来解决企业中所发现的问题,尤其在关键考核节点的复盘中,能够系统梳理并解决问题,帮助企业达成业绩。
帕累托分析(ABC分析)
用于分析哪些产品、哪些客户为企业提供了核心价值,本分析主题中产品帕累托分析与客户帕累托分析结合使用,帮助企业发现哪一类产品是企业最重要的产品板块,每一个产品板块中哪些客户是最核心客户,可以帮助销售团队针对各产品板块制定客户的销售策略。
波士顿矩阵分析
最初波士顿矩阵用于分析企业各类产品的成长性与市场占有率的情况,现在更多的衍生到其他指标的一些分析中,例如:本模型中分析的是不同产品类别发书码洋、退货率与退书码洋增长率的情况,帮助企业重要板块的核心问题。
具体分析框架如下:
4.数据处理
指标口径:
指标名称
指标定义
码洋
图书定价*数量之和
出库码洋
图书定价*出库数量之和
生产码洋
图书定价*入库数量之和
新书
印次结尾为-1的图书,即一个书号第一次印刷
重印
印次不以-1结尾的图书,即同一书号第二次及之后印刷
回款实洋
客户到款并销账的图书总金额
销账均折扣
客户到款并销账的图书总金额/对应图书总码洋
发书码洋
从仓库发出的图书码洋
退书码洋
退回到仓库的图书码洋,系统中码洋为负值
出库码洋
发书码洋+退书码洋
退货率
-退书码洋/发书码洋
数据表及关联逻辑
5.可视化报告
配色
因为自己一直很喜欢一本书——《中国传统色-故宫里的色彩美学》,很多色彩来源于中国古代的画作、故宫中的文物等,每一种颜色都一个很好听的名字,所以给了我很多可视化配色的灵感,从这本书中搭配了可视化的配色。定性和定量色板如下:
顺便推荐一个很好用的配色网站:https://www.vis4.net/palettes/#/9|s|00429d,96ffea,ffffe0|ffffe0,ff005e,93003a|1|1
数据处理及仪表板搭建
a).主题模型搭建
由于图书编码与版印次合并之后才是产品表与批发查询、入库查询表的唯一关联字段,所以需要增加关联字段,并建立主题模型
由于表格之间关联使用主题模型,所以在明细数据层处理的步骤较少,仅做了少量条件标签列,其他表添加列之类的处理,所以不再赘述。
b).过滤组件绑定参数对指标进行明细过滤
大部分数据处理过程在组件中进行。例如:通过过滤组件时间段参数计算两年同期对比情况。
新建一个时间段参数,命名为考核时间段日期参数
这个地方要吐槽一下这个默认值功能,只能选择某一天,其他的例如时间段的默认值是没办法选的。
将入库码洋字段复制并重命名为2023年生产码洋,做明细过滤,选择参数,选自定义步长,同一步长;同理复制入库码洋并重命名为2022年生产码洋,选择1年前的同一步长。
新建时间段过滤组件并绑定参数。
即可得到精确到天的同比于去年的生产码洋对比。增长率等常规函数计算不再赘述。
其他出库、发货、退货码洋的明细过滤同理。
c).计算退货码洋增量贡献率
首先计算退货码洋增量
计算退货码洋增量贡献率
将相应维度和指标拖入分析区域,使用分组表格,退货码洋同比增减幅开启数据条。
d).发书码洋、退货率、退货率增量气泡图制作
计算2023年退货率
计算2022年退货率
计算退货率同比增量
将相应指标和维度拖入分析区域
这里有一个小小的吐槽,就是所有仪表板过滤组件传参,对指标进行明细过滤的字段,都会存在在组件里编辑的时候无法看到最终的结果,只有在仪表板中才能看到最终的图表是什么样的。最终是这样子的。
e)地图
将省份转为地理角色
将经度拖入横轴,维度拖入纵轴,将2023年出库码洋拖入颜色和大小中,就得到了点地图。
f).多系列柱状图+折线图(开启堆积)
计算目前所选时间的任务缺口,新建两个时间参数,一个是考核开始时间,一个是目前时间
这里因为原始数据只取了半年的,所以目前时间的默认值设为了2023年6月30日,在企业常规的分析中,这个时间可以用动态
将之前的时间段过滤组件的开始时间和结束时间分别绑定参数给考核开始时间和目前时间。
新建计算字段计算当前任务缺口,这两个参数作为dateif函数中的开始时间和结束时间,动态计算选择日期区间在全年所占天数,动态计算目前应完成任务数。
计算各渠道任务完成率
将相应字段拖入分析区域
2023年出库码洋和出库任务缺口需要开启堆积
最终呈现效果
可视化报告解读
网络书店任务渠口近5000W,抖音渠道完成率为各渠道最低。
进一步通过渠道与客户城市联动可以看出,抖音渠道在上海的客户虽然增量较为明显,但其他地区的客户拓展存在很大问题,需进一步增加其他经济发达地区例如:北京、浙江、福建、广州等城市的抖音渠道拓展。
销售经理Penelope同比去年业绩出现较大下滑,
与客户同比进行关联分析,主要下降来自于图书公司90和图书公司25这两家大客户。
进而对图书公司90和图书公司25进行下钻。
可以看到图书公司90和图书公司25下降的类别均集中在ZXYY和ZXYW两个类别。所以是这两类产品需要销售端更多关注,主要要进行工作:1、复盘并及时调整这两类产品的营销策略,为图书公司90和25两家客户找到新的增长点。
退货的增量主要由于天猫渠道和实体渠道的退货增长所造成,两个渠道占据了退货增量的80%以上。
通过渠道与不同业务分类的退货情况联动,找到退货增量较大、退货率较高、2023年发书码洋较高的产品,从图中可以看到主要要解决实体书店ZXYY、ZXYW、ZXSX这三类产品的退货问题。
而网络书店退货存在较大问题的是ZXSX类产品。
通过帕累托分析,对A类产品(码洋累计占比前80%的头部产品)的A类客户(码洋累计占比前80%的头部客户)进行复盘,结合客户出库的同比增减幅,对于A类产品的A类客户存在出库同比下降的情况进行重点关注。
对各编辑室的生产码洋情况进行复盘,可以看出编辑室A的生产码洋出现超1.1亿元的缺口,再分析编辑室A的新书和重印情况,可以得之重印生产码洋出现了下滑。
再对各编辑室的图书出版年份进行分析,可以看到编辑室A出版5年以上图书占比最大,且新品占比最低,说明编辑室A的新的选题策划和出版方面存在问题。
可视化报告展示
三、参赛总结
FineBIV6.0产品易用性:我是从2021年开始使用FineBI的“老用户”,在去年12月V6.0发布之后我还有些担心自己会不适应。结果当今年3月企业正式部署V6.0开始使用时,我发现居然自己很快就无缝切换到了V6.0版本。并且在后续25位设计用户的推广当中,V6.0版本对于新手设计用户是非常友好的,分析主题使得数据处理、组件和仪表板呈现集成在一起,主题模型减少了V5.1版本大量的中间表和辅助列的加工,便于新手用户更加便捷的进行基础操作。而主题模型、def函数这些新功能也给专业设计用户提供了更加复杂模型和图表的可能性。
最有价值的功能点:个人觉得V6.0最有价值的功能点那一定是主题模型啦,解决了之前左右合并数据膨胀的很多问题,尤其在计算各类考核(企业各部门考核完成情况、销售经理业绩完成情况、编辑生产考核情况)等这类之前只能通过中间表完成的数据分析工作是非常友好的。
小小的功能吐槽(数据处理方面):目前在数据处理方面,如果使用【添加其他表列】之后再去公共数据修改字段转义名之后,在分析主题下面【添加其他表列】的字段依然显示原始名,刷新也无法显示转义名,只有把添加的列来源的表在分析主题中删除再重新添加才能显示公共数据最新修改的转义名。这个刷新的小问题对新手用户是比较困惑的。另一处需要显示转义名而显示原始名是【公共数据】的【编辑】界面,点编辑进入编辑界面显示字段转义名,再对字段进行设置即显示了原始名,还需要再根据字典找要设置的字段是什么,这个地方的逻辑需要优化一下。
小小的功能吐槽(在仪表板方面):时间过滤组件有个小问题。前台显示相同的动态时间和人为选择时间,而过滤的结果不同,按天偏移的时候以天为单位(即6月的最后一天后台其实是2023-06-30 23:59:59)而人为选择时就是所看到的时间,导致两者不一致。很多用户对这个过滤组件截止的这一天数据是否包含的问题非常困惑。
4.参赛总结
今年在企业FineBI的推广当中,有很多小小的成就感,例如:一些对数据分析很擅长的用户借助FineBI平台实现了更多的对于数据各种角度的分析,分析的效率也极大提高;另一些之前从来没有接触过FineBI的用户借助这个平台实现了自身价值的提升,通过这个项目实现了企业和员工个人的双赢。
作为企业的数据分析师,就像游戏通关一样一路需要升级打怪,以前熟练使用Excel就能做数据分析的时代已经过去了,作为企业的数据分析师,FineBI已经是基础技能,而今年大火的RPA、ChatGPT更将彻底颠覆很多行业的模式,所以,任何的岗位,都要不停的迭代自己的技能,才能实现个人价值的不断增值。
0%出版社经营情况分析20230813.pdf (7.9 M)