【2022BI数据分析大赛】食品饮料抖音直播电商播主和商品分析
一、选手简介
1 、选手介绍
团队名称:三个臭皮匠
成员成员:
PP,队长,南京信息工程大学应数专业,之前有做过数据分析相关的实习,但只是纯纯“取数工具人”,自学过Python爬虫和机器学习,独立完成过一些爬虫项目,例如爬取一年中所有的稀土金属数据等。这次比赛主要负责确定分析思路,图表工作和报告撰写。
Sunshine,南京信息工程大学信息与计算科学专业,熟练掌握matlab,spss等软件,这次主要负责分析思路的确定和图表工作。
Tsunami,南京信息工程大学大数据专业熟练掌握matlab c/c++ python 发表过一篇发明专利,此次负责分析思路的确定和图表工作。
2、参赛初衷
数据可视化是数据分析中不可或缺的一环,希望通过这次的比赛熟悉FineBI的使用方法和技巧
未来想从事数据分析相关的工作,提前熟悉和了解工作内容,丰富简历
与队友互相磨合,实现“1+1>2”的效果
二、作品介绍
1、业务背景
刚入职某食品公司不久的小王,小顾和小陆想了解食品饮料行业的直播电商情况,通过分析近六个月抖音直播的数据来发现热门播主和爆款商品的特点,并为公司未来生产商品和选播主提供建议。
2、数据来源
自选数据:来自飞瓜数据抖音版的商品榜月榜食品饮料和带货主播版食品饮料,两张表时间均为2021年3月到2022年4月。商品榜表原始数据字段包含商品标题、品牌名称、商品券后价和抖音销售额等的详细数据,带货主播榜原始数据字段包含昵称、播主性别、直播销量等的详细数据。
3、分析思路
先上脑图
首先我们明确这次分析的目的,目的是分析得出热门主播和爆款商品的特点,并给出选品和播主的建议。我们参考了一些直播电商的相关报告寻找思路,经过讨论决定采用top-n分析。
播主分析,我们先按照播主所属行业分类,想了解哪些行业的播主的销售额和粉丝粘度高,然后我们对播主性别进行分析,查看播主的男女占比,对比男女播主的平均带货指数和热度,之后再对各个段位播主的销售额进行分析,根据粉丝数和销售额对播主进行分类,划分为头,肩,腰,潜力主播和品牌自播,清楚各段位播主的销售情况,对比品牌自播和其他播主,最后我们再对潜力主播进行挖掘,根据播主的粉丝数和销量关系图,找到较低粉丝数却有高销量的播主。
商品分析,我们通过细分类目(食品饮料>零食/坚果/特产>肉干肉脯/熏腊卤味/肉类熟食,类似这种,食品饮料为细分类目1,零食属于细分类目2,以此类推)和品牌两个角度分析商品。从细分类目的角度出发,找到细分类目2的销量前top5,再分析细分类目2里的细分类目3的占比,然后再通过关联直播数分析找到关联直播数前top3的细分类目2里的细分类目3的占比,上面两者结合发现热销商品。从品牌角度我们通过抖音销售额、抖音销量、品牌名三个维度分析抖音用户对国内外品牌的倾向程度。最后我们通过分析商品券后价来预估抖音用户的平均消费能力。
4、数据处理
首先关于商品分析原始数据里面的细分类目,我们需要将单个字段按">"划分为细分类目2和细分类目3,使用到了indexofarray()函数和split()函数来实现。
对于播主的段位划分(头,肩,腰,潜力,品牌自营)的数据处理
分组汇总,首先通过关键字筛选出自营主播,勾选未分组的值分到其他
数据处理1
筛选结果:
数据处理2
另存为一个数据集
不勾选未分组分到其他,结果如下
数据处理3
删选出非自营主播
继续分组汇总,粉丝数区间分组
数据处理4
数据处理5
筛选结果如下:
数据处理6
另存为一数据集
合并两表(上下合并)
数据处理7
合并结果如下:
数据处理8
5、可视化报告
播主所属行业美食的2022年3月份直播销量占比达到了63.38%,增长率是跟2021年11月份的销售情况作对比,top5中只有健康行业为正增长
销售占比top5组合图
粉丝粘度的计算公式为销量/粉丝数,艺术、动漫和手工手绘的粉丝粘度较高,挑选主播时可以往这些行业靠
女播主的占比超过了3/4。带货口碑和带货指数是飞瓜数据根据各项指标综合算出,已在原数据表中,我们根据男女和时间分组汇总,然后计算平均值,男女播主口碑和指数相差不大,较于2021年11月均有提升。女播主人均场均观看人次和人均直播销量均高于男播主,但较于2021年11月份,两个指标均下降,并且男女播主差距减小至几乎相等。
男女播主的差距在减小并且带货能力均在增强,但是直播数据均在下降。
男女占比饼图
男女播主带货口碑和带货指数对比
场均观看和直播销量男女对比柱图
现将播主按照是否自营划分为两派,在对自营的播主根据粉丝数划分为超头部,头部,肩部,尾部主播,划分标准参考卡司数据。超头部主播第一,尾部主播由于播主基数大,直播销量总额排到了第二,品牌自营的直播销量其次,品牌自播的直播效果较好,销售量的增幅是相较于2021年11月份的数据,只有超头部主播正增长。
不同段位播主销售数据组合图
通过直播销量和粉丝数来挖掘潜力主播,低粉丝数和高直播销量为潜力主播,即图中的左上角。
潜力主播挖掘散点图
通过抖音销量和关联直播数两个堆叠柱图,我们可以清楚抖音视频饮料行业的大体构成,销量最多的是零食/坚果/特产,其中糕点,饼干和坚果占比较多,销量其次的细分类目2是粮油米面和咖啡。关联直播数的排名相似,反映的是在抖音上热度较高的商品的所属分类。
抖音销量top5具体产品的堆叠柱图
关联直播数top5具体产品的堆叠柱图
通过销售额销量品牌散点图,我们想清楚在抖音上受欢迎的品牌为国内还是国外,除了十字的左下角,均为高销量或者高销售额,3/4的品牌属于国内,所以国内品牌在抖音食品饮料直播中更受欢迎。
销量销售额品牌散点图
由于原数据为价格区间(例如:3.5-63),我们根据‘-’分割字符串得到最低值,然后画出下面这张图,扇形的半径大小为平均转化率,计算公式为销量/浏览量,扇形占比的大小为销量,由图中可知0~10销量占比达到了46.82%,并且转化率最高,抖音上的用户能较能接受的价格区间和转化率较高的为0~40元。
消费价格欲望区间饼图
最终效果:
最终仪表板
三、参赛总结
1、FineBI工具
FineBI工具的易上手性是我们所相互认可的,我们在这次比赛中只是接触了其最基础的一些功能,很期待以后我们能用它做一些更有意思的分析图。关于BI亮点功能,FineBI小助手在我们绘制图表时提供了很多帮助,我们所遇到的大部分的困难都可以通过小助手解决,模板的配色也非常的可。Tab组件将相关的分析图表汇总,组件的灵活性和实用性让我们更加的爱上了FineBI。这是我们第一次正式的去做数据分析,感受到了数据背后所反射出的相关业务问题,但关于数据的价值挖掘,我们还处于小白的阶段,无限进步吧!
2、参赛总结
队友之间的沟通,FineBI实现队友之间的图表共享等等一些困难,解决时很痛苦,但使我们成长。此次的比赛最重要的让我们从零跨出,并且学会了一个功能强大的BI工具。感谢职场人士的场外指导,感谢赛事方举办这次数据分析的比赛,感谢队友们的积极配合。
最后分享下最近看到的一句话,数据分析只是一个很好的一个起点,但它不是绝对不是一个完美的职业终点,加油吧,数据人。