【2022BI数据分析大赛】京东电商用户与店铺分析驾驶舱
Your browser does not support video tags.
一、选手简介
1、选手介绍
个人介绍:帆软社区用户名Abbey660,我是在电商行业做数据分析师。个人感兴趣业务分析与BI可视化。
2、参赛初衷
我上一年也参加了Fine BI可视化大赛,觉得国内BI软件中Fine BI很适合日常工作与分析,这次的比赛主要想提升自己的Fine BI技能,同时也了解到Fine BI这次比赛更加注重分析流程、分析价值与业务逻辑,所以想通过做BI的过程中,能提升自己的逻辑与分析能力。我相信,这是目前BI工程师与数据分析师的痛点,通过BI分析出更多业务中的痛点以及价值,这将是未来BI的主流方向。同时希望与更多FineBI大神交流学习,有更多的分析思维的激烈碰撞。最后,这次FineBI官方比赛的奖品真的很给力,我觉得对数据人的一种鼓励与肯定。
二、作品介绍
1、业务背景/需求痛点
简述业务背景,
数据来源于和鲸社区的京东电商数据,主要是行为数据、用户数据、评论数据、商品数据、商家店铺数据。
简述需求痛点:
由于是网上数据,没有指明需求,但可以先搭建店铺与人员指标,查看店铺状况,同时可以根据目前已有的数据做店铺分析以及用户画像,发现店铺中的痛点,给出营销策略。
2、数据来源
自选数据:总共有5个表,部分数据下载之前已做了脱敏处理。
3.分析思路
4、数据处理
由于数据没有销售额与客单价,在做RFM的时候少了M,这时候我想到用VIP等级来判断用户消费水平,总共分为7个等级,等级越高,消费能力越强。
1.选取jdata_action中的user_id,action_time,type字段
2.过滤数据等于2,2为下单的数据。
3.左右合并jata_user的表中的user_id,user_lv_cd字段,合并依据是user_id。
4.将user_lv_cd由文本格式改为数字格式。
5.根据用户分组汇总,由于同一个用户的等级是一样的,所以这里用平均数,以免相加影响结果。
6.修改字段名称
7.新增列,计算最近一次消费距今的时间。
8.新增列,计算平均消费,7的平均数就是3.5,这里直接写上了。
9.新增列,计算平均用户消费次数
10.新增列,计算最近一次消费至今平均天数
11.新增列,计算次均消费金额评价
12.新增列,计算消费次数评价
13.新增列,最近一次消费距今天数评价
14.新增列,合并RFM
4.1整体分析
(1)数据含义表达和图表排版布局。
第一部分是整体分析的布局,构建指标有:浏览量,下单量,用户数,男女占比,VIP级别占比,客户年龄分布,销量TOP 10 城市。风格主要以商业风为主。
(2)通过分析得出的结论
1.京东店铺男女消费群体各站一半,差异不大
2.主要客户来自348、204、119城市
3.店铺主要客户VIP占比较高的是1级,占30.19%,其次是6级占27.42%,需要引导1级用户升为2级,6级用户升为7级
4.客户主要年龄分布主要在第五个等级,其次是第六个等级,可以根据用户年龄层来开发适合用户的产品。
4.2用户画像
(1)数据含义表达和图表排版布局。
第二部分是用户画像,构建的指标与模型有:
用户生命状态模型:根据用户从新用户到流失用户的生命周期计算目前每个的时期的占比与数量。
复购率:根据用户多次购买计算复购率,分析用户黏性。
行为漏斗:根据每个用户行为的漏斗转化率得到哪个行为转化率异常,另外加购和关注虽然不是最后的行为,为了保持数据的合理性,把它们放置到最后。同样也可以分析到其转化效果。
RFM模型,根据最近一次购买数量,购买频率,购买金额将用户分成8种类型的用户,可以实施不同的营销策略。
(2)通过分析得出的结论
1. 本店忠实用户占80%,用户黏性很高
2. 4月份的复购率下降,下降了3.12%,需要用优惠券等手段召唤老用户,提高用户复购率。
3.浏览量到下单的转化率有6%,符合一般电商行业状态,下单后评价转化是37%,可以用好评返现等形式提升评价数量,另外加购和关注远远少于下的那人数,可以用优惠券,小礼品等手段引导用户关注,优惠价预售活动引导用户加购。
4. 本店客户大头是一般价值客户和一般保持客户,两者加总占60%,说明有大部分消费者的消费能力不高和,应向该客户推送公司主营业务,通过宣传推广让产品信息送达客户手中。
5.其次是重要挽留用户、重要发展用户,重要保持用户与重要价值用户,占比40%,对于重要挽留用户,消费频率不高和最近消费比较远,可以通过短信方式,活动优惠券发放等方式挽留用户,对于重要发展用户,这部分消费频率不高,忠诚度不高,很有潜力的用户,必须重点发展。
6.本店铺主要客户来源于741国家和2136国家,其次是2316,187国家。
4.3评分分析
(1)数据含义表达和图表排版布局。
指标有好评TOP 10产品,差评TOP 10产品,好差评占比,每周评论趋势
(2)通过分析得出的结论
1.好评产品前三分别是217024,219334,25448,可成为店铺的主打产品,差评产品前三分别是217024,171917,25338。差评产品要优化。
2.店铺的好评率是98.95%,产品质量以及服务整体不错。
3.整体的好评与差评趋势较为平稳。
4.4店铺与品牌分析
(1)数据含义表达和图表排版布局
图表与指标有:店铺热卖品类,7级VIP的品牌喜好,0分析店铺数据,百万粉丝店铺的粉丝数,VIP数,评分对比。
(2)通过分析得出的结论
1.0粉丝店铺总共有656家,其中店铺5566,粉丝数0,店铺评价-1,vip数201,VIP数不错,但评价却是负数,要查看你该店铺的是否客服没有做到位。0粉丝僵尸店铺要合理清除,以免占用资源。
2.百万粉丝店铺中,1912,3790店铺的vip数量极低,需要将粉丝数转化为VIP,可以加强宣传,或升级VIP附送小礼品促进店铺的VIP提升。
3.店铺热卖产品可以升级为主打产品,大理宣传。
4.根据7级会员的品牌喜好,推荐相关品牌的产品,实现精准营销,促进成交率。
最后主图展示
三、参赛总结
1、FineBI工具
FInebI自助数据集还是挺好用的,只需要点击选择即可轻松清洗数据,省去代码的思考时间。
另外也有一键排版布局,在美观度上还是不错的。
在可视化当中,如何才能体现图形带来的价值,我认为应该站在看这张报表的人上思考这个问题,比如同样是条形图,除了看高低之外,业务下一步会做什么?会找标准去对比该数据是否异常,这时候我们只要多想一步,添加一条辅助线,这个从原本的多少,变成对比分析后的异常数据,这样更加体现的图形带来的业务价值。
2、参赛总结
克服的困难:当我看到产品数据时,第一时间联想到购物篮分析,奈何我电脑配置不够,及时构建了自助数据集,也更新不了,后来我导入了SQL,python构建指标,都报错,显示我的电脑内存问题,后来我直接找电竞网吧,租了VIP级别的电脑,直接在上面做,做出来之后我以为是我的数据异常,因为显示图形是空白的,不是每一个都有颜色的方块,只有隔了好远才出现的一条颜色, 于是我问技术员,自己也核对数据看是否出错,才想明白,其实并不是每种订单数据适合做购物篮,像这种客户都是单个购买比较多,很少跟其他商品一起购买的,是不适合做购物篮分析的。模型有很多,但是并不是每个都合适。
感恩的事儿:虽然是个人赛,不过自己有问题的时候也会问问大赛的技术导师,导师真的很用心负责,及时很晚了,还是回答我的问题。
遇到的人儿:感恩遇到一群志同道合的人,感恩遇到技术导师。
认知新感悟:既然时间已经花在这里,就认真对待,想要得到一个好的结果。