一、个人介绍:
帆软社区用户名sunny,目前正在失业中,正在全系统的学习大数据链路分析。从事职位数据分析工作,个人感兴趣的领域是金融和销售分析。
二、参赛初衷:
希望通过比赛提升BI工具的使用方法和技巧,并且希望通过获得比赛获奖提升在数据分析或者可视化方向简历上的亮点。
三、业务背景:
通过分析该数据,了解该在线商店的销售状况,尝试发现问题,并提出建议,以期改善经营状况
四、数据来源:
数据来自和鲸社区,该数据为2020年4月至2020年11月某大型家用电器和电子产品在线商店的销售数据。总数据集54万条。事件时间、产品ID、类别ID、类别代码、产品品牌、用户id。
五、分析思路:
明确这次分析的思路是了解商店的销售状况,尝试发现问题,并提出建议,改善经营状况。所以采用了人货场的分析方法。
1、基于场的分析,从整个平台的销售额、销量、以及客户数统计分析,以及各个时间和各个地区的销售探索,整个平台在1-8月份呈现上升趋势,8月达到顶峰,然后就开始下降。
2、基于货的分析,从帕累托分析模型A类品牌销售额占比,以及各品牌TOP10的销售额、销量、以及客单价探索,销售量和销售额贡献值大的都是三星和苹果。但是客单价高的反而是yamaguchi、technogym、kona三个品牌,所以针对这三个品牌需加强流量倾斜,在高客单价基础上,提高销售额。并且利用波士顿矩阵模型分析各产品类别的明星产品。
3、基于人的分析,从客户的静态结构和动态结构分析客户的偏好,并且根据RFM模型对客户进行分层,达到精准营销。
六、数据处理:
通过上传2个数据集,一个全量的电子产品数据表,一个经过excel处理过的rfm模型表
由于电脑问题,已经添加的自助数据集左右关联excel数据集,数据关联成功后更新不成功,故处理数据集在excel表格中处理。
1、维度处理:
订单日期处理:利用left函数截取前10,并将字段类型修改成日期;利用Mid函数截取下单时间。
RFM模型处理:取每个客户最近一次交易时间,设置当前时间为:2020-11-22日,用当前时间-最近一次交易时间,就可以得到每个客户购买的时间间隔。
价格区间处理:利用if函数嵌套将价格进行数据分桶。
年龄区间处理:也是利用IF函数嵌套将年龄进行数分桶。
2、指标数据:
客户数量:将客户id去重统计
客单价 = 销售额/购买用户数
|