一、选手简介
1、个人介绍 帆软社区用户名andy-lin,坐标深圳,之前从事数据分析相关工作,工作使用过Finebi做项目,个人感兴趣的方向是业务数据分析 方向,希望能深入某个行业做数据分析相关工作。
2、参赛初衷 a.希望通过比赛重新熟悉FineBi,提升BI工具的使用方法和技巧。 b.通过参赛锻炼自己,发现自己的不足之处。
二、作品介绍
1、业务背景 这是一家某网约车公司,公司希望能看到当前网约车业务的整体情况,主要是平台经营情况和客户行为偏好分析,有了这些分析后,公司希望能针对不同的客户采取不同的维护策略,因此希望公司数 据小组出具一份数据分析报告,能给于业务部门一些参考意见。
2、数据来源
自选数据:根据网上公开数据进一步加工得到。
原始数据字段信息:
3、分析思路 搭建业务分析框架,可以从指标,业务,流程三个角度出发 整体分析框架主要是通过OSM + 用户生命旅程角度和"人货场"开展
|
目标O
|
策略S
|
度量M
|
获取A
|
获取新客户
|
拉新,渠道推广,打广告
|
新增用户数,新注册用户数,注册转化率
|
活跃A
|
提高使用频率
|
运营活动,活动奖励
|
日活,月活,浏览量,点击量
|
留存R
|
提升留存率
|
优化产品功能,用户运营活动
|
留存率,流失率
|
变现R
|
提高收益
|
提供多种支付方式,提高支付体验
|
客单价
|
传播R
|
获取新用户
|
分享
|
K因子
|
分析维度:客户,车型,城市,时间,渠道,设备 分析方法:交叉分析,下钻分析,对比分析,TOPN分析(静态和动态),RFM分析,帕累托分析,四象限分析 4、数据处理
有哪些表,原始数据是怎样的,处理后的数据是怎样的,做了哪些处理
用户订单数据表,2020中国城市分级数据
表名
|
类型
|
2020中国城市分级数据
|
维度表
|
用户订单数据明细表
|
事实表
|
4.1数据读取
用户订单数据表原始数据有两份excel表,字段完全相同,故需要进行合并,使用python处理,IDE是jupyter lab。
读取数据
4.2数据清洗
a.转换格式
b.删除重复字段
用户订单基础数据表和用户基础数据表存在重复数据,用户基础数据表比用户订单基础数据多出两个重复字段order_car_type_id和order_car_type_name,需要删除处理。
c.数据合并
d.查找重复值
f.查找缺失值
g.查看关键字段的唯一值
1.服务类型
2.订单状态
3.车型
4.订单分类
5.接单类型
6.订单来源
发现异常值,如有特殊符号?,进行数据清洗。
4.3宽表制作
主要为了得到两张自助数据集宽表,用户订单数据和综合标签用户订单表
2020中国城市分级数据和车型维度表数据作为维度表,用户订单数据作为事实表,三表进行关联创建自助数据集。
4.3.1用户订单数据
a.用户订单数据表左合并车型维度表
是否提前预订--根据预订日期和用车日期的时间差判断
城市群--根据城市打标签,主要是京津冀,江浙沪,川渝,粤港澳四个城市群
星期几--根据用车时间判断是星期几
4.3.2综合标签用户订单表
a.RFM分析
过滤:RFM标签只根据完成的订单计算
• 最近一次消费时间(R):客户距离最近的一次用车时间的间隔。--用车时间
• 最近一段时间内消费频次(F):指客户在限定的期间内所购买的次数。--订单消费频次
• 最近一段时间内消费金额(M):客户的消费能力,通常以客户单次的平均消费金额作为衡量指标。--用车花费金额
具体计算过程可以参考官方教程: https://help.fanruan.com/finebi/doc-view-703.html
b.取消订单用户表
因为计算RFM时过滤掉取消订单的数据,这里根据订单状态和下单数量计算出那些一次下单且取消订单的客户
c.将RFM表和取消订单用户表合并得到综合标签用户订单表
5.可视化报告
5.1整体情况分析
从各个维度描述,覆盖城市,订单完单率,用户分布,订单金额贡献,订单渠道,客户设备,车型偏好,出行服务,客户价值
5.2城市订单贡献分析
通过城市群,城市分级,城市,车型四个不同维度展示订单贡献情况,使用帕累托分析法(参考: https://help.fanruan.com/finebi/doc-view-702.html) ,也就是常听到的二八法则。
提供过滤组件,可以对日期,城市分级,城市进行筛选。
5.3出行场景和服务分析
维度有工作日,周末,用车场景分为预约用车和即刻用车。对比工作日和周末,预约用车和即刻用车,不同出行服务的订单量
提供交叉明细表,可进行城市分级维度下钻分析
a.使用RFM模型对客户进行价值分层,共分出8类不同的用户,加上针对一次下单且取消的客户,总共分出9类不同价值的客户,针对不同的客户采取不同的维护和营销策略。
b.首次接单类型分析,针对系统的派单逻辑,根据两个完单率和客单价两个维度去评判派单的质量,总共分为四个象限。
定位仅成交一单的客户价值和客户分布情况,后续可针对具体客群和城市进行问题跟进。
总体结论前置,先上总体结论,然后再根据不同维度展开分析。利用组件背景突出结构化显示。
模块化的工具能更高效的处理数据和计算指标,能让分析人员把更多的精力投入分析中。
自带的仪表板配色,能轻松快速的完成美化。
2、项目总结 数据分析流程:1.分析目的2.分析框架3.数据获取4.数据清洗5.数据分析和可视化6.数据报告7.落地闭环 明确分析目的,搭建分析框架是重点,梳理好框架后续才能越走越顺,不要盲目做图表。 将来的你一定会感谢现在努力的你,加油,打工人,加油,数据人。
2021帆软BI夏季挑战赛_网约车平台数据分析_林汇泉.pdf (4.15 M) 编辑于 2021-8-10 22:43
|