【2021夏季挑战赛】网约车平台数据分析

我是社区第253098位番薯,欢迎点我头像关注我哦~
一、选手简介
1、个人介绍
帆软社区用户名andy-lin,坐标深圳,之前从事数据分析相关工作,工作使用过Finebi做项目,个人感兴趣的方向是业务数据分析 方向,希望能深入某个行业做数据分析相关工作。
2、参赛初衷
a.希望通过比赛重新熟悉FineBi,提升BI工具的使用方法和技巧。
b.通过参赛锻炼自己,发现自己的不足之处。

 

二、作品介绍
1、业务背景
这是一家某网约车公司,公司希望能看到当前网约车业务的整体情况,主要是平台经营情况和客户行为偏好分析,有了这些分析后,公司希望能针对不同的客户采取不同的维护策略,因此希望公司数 据小组出具一份数据分析报告,能给于业务部门一些参考意见。

2、数据来源
自选数据:根据网上公开数据进一步加工得到。
原始数据字段信息:
截图202106291125436635.png
3、分析思路
搭建业务分析框架,可以从指标,业务,流程三个角度出发
整体分析框架主要是通过OSM + 用户生命旅程角度和"人货场"开展
  
  
  
目标O
  
  
策略S
  
  
度量M
  
  
获取A
  
  
获取新客户
  
  
拉新,渠道推广,打广告
  
  
新增用户数,新注册用户数,注册转化率
  
  
活跃A
  
  
提高使用频率
  
  
运营活动,活动奖励
  
  
日活,月活,浏览量,点击量
  
  
留存R
  
  
提升留存率
  
  
优化产品功能,用户运营活动
  
  
留存率,流失率
  
  
变现R
  
  
提高收益
  
  
提供多种支付方式,提高支付体验
  
  
客单价
  
  
传播R
  
  
获取新用户
  
  
分享
  
  
K因子
  
分析维度:客户,车型,城市,时间,渠道,设备
分析方法:交叉分析,下钻分析,对比分析,TOPN分析(静态和动态),RFM分析,帕累托分析,四象限分析
  4数据处理
有哪些表,原始数据是怎样的,处理后的数据是怎样的,做了哪些处理
用户订单数据表,2020中国城市分级数据

表名

类型

2020中国城市分级数据

维度表

用户订单数据明细表

事实表

 

 
4.1数据读取
用户订单数据表原始数据有两份excel表,字段完全相同,故需要进行合并,使用python处理,IDEjupyter lab
读取数据
4.2数据清洗
a.转换格式
 
b.删除重复字段
 
用户订单基础数据表和用户基础数据表存在重复数据,用户基础数据表比用户订单基础数据多出两个重复字段order_car_type_id和order_car_type_name,需要删除处理。
 
c.数据合并
 
d.查找重复值
e.删除重复值
删除完全重复的数据

f.查找缺失值

 

g.查看关键字段的唯一值

1.服务类型

2.订单状态

3.车型

4.订单分类

5.接单类型

6.订单来源

发现异常值,如有特殊符号?,进行数据清洗。

4.3宽表制作

主要为了得到两张自助数据集宽表,用户订单数据和综合标签用户订单表

2020中国城市分级数据和车型维度表数据作为维度表,用户订单数据作为事实表,三表进行关联创建自助数据集。

4.3.1用户订单数据

a.用户订单数据表左合并车型维度表

b.新增衍生字段
是否提前预订--根据预订日期和用车日期的时间差判断
城市群--根据城市打标签,主要是京津冀,江浙沪,川渝,粤港澳四个城市群
c.左合并2020中国城市分级数据
d.新增衍生字段
用车类型--预约用车,即刻用车
星期几--根据用车时间判断是星期几
 
4.3.2综合标签用户订单表
 
 
a.RFM分析
过滤:RFM标签只根据完成的订单计算
最近一次消费时间(R):客户距离最近的一次用车时间的间隔。--用车时间
最近一段时间内消费频次(F):指客户在限定的期间内所购买的次数。--订单消费频次
最近一段时间内消费金额(M):客户的消费能力,通常以客户单次的平均消费金额作为衡量指标。--用车花费金额
具体计算过程可以参考官方教程: https://help.fanruan.com/finebi/doc-view-703.html
b.取消订单用户表
因为计算RFM时过滤掉取消订单的数据,这里根据订单状态和下单数量计算出那些一次下单且取消订单的客户
c.将RFM表和取消订单用户表合并得到综合标签用户订单表
 
5.可视化报告
5.1整体情况分析
从各个维度描述,覆盖城市,订单完单率,用户分布,订单金额贡献,订单渠道,客户设备,车型偏好,出行服务,客户价值
5.2城市订单贡献分析
通过城市群,城市分级,城市,车型四个不同维度展示订单贡献情况,使用帕累托分析法(参考: https://help.fanruan.com/finebi/doc-view-702.html) ,也就是常听到的二八法则。
提供过滤组件,可以对日期,城市分级,城市进行筛选。
5.3出行场景和服务分析
维度有工作日,周末,用车场景分为预约用车和即刻用车。对比工作日和周末,预约用车和即刻用车,不同出行服务的订单量
提供交叉明细表,可进行城市分级维度下钻分析
 
5.4客户价值和首次接单类型分析
a.使用RFM模型对客户进行价值分层,共分出8类不同的用户,加上针对一次下单且取消的客户,总共分出9类不同价值的客户,针对不同的客户采取不同的维护和营销策略。
b.首次接单类型分析,针对系统的派单逻辑,根据两个完单率和客单价两个维度去评判派单的质量,总共分为四个象限。
优质首次派单:客单价高,完单率高。
普通首次派单:客单价低,完单率高。
问题首次派单:客单价低,完单率低。
待优化首次派单:客单价高,完单率低。
c.仅成交一单的客户分析
定位仅成交一单的客户价值和客户分布情况,后续可针对具体客群和城市进行问题跟进。

5.5图表排版布局
总体结论前置,先上总体结论,然后再根据不同维度展开分析。利用组件背景突出结构化显示。
070120282480_02021帆软BI夏季挑战赛_网约车平台数据分析_林汇泉_1.jpg

三、参赛总结

1FineBI工具
模块化的工具能更高效的处理数据和计算指标,能让分析人员把更多的精力投入分析中。
自带的仪表板配色,能轻松快速的完成美化。
2、项目总结
数据分析流程:1.分析目的2.分析框架3.数据获取4.数据清洗5.数据分析和可视化6.数据报告7.落地闭环
明确分析目的,搭建分析框架是重点,梳理好框架后续才能越走越顺,不要盲目做图表。
将来的你一定会感谢现在努力的你,加油,打工人,加油,数据人。

2021帆软BI夏季挑战赛_网约车平台数据分析_林汇泉.pdf (4.15 M)

编辑于 2021-8-10 22:43
参与人数 +1 贡献 +1000 F币 +1000 理由
帆软苏茜 + 1000 + 1000 恭喜荣获“最佳行业应用奖”

查看全部评分

发表于 2021-6-29 10:16:44
发表于 2021-7-17 16:02:32
666
发表于 2021-8-16 16:10:23
亲,两份数据源能共享一下吗?
发表于 2021-8-23 16:01:32
同求数据!感谢
发表于 2021-12-8 13:49:20
发表于 2023-10-15 17:24:11
大佬,可以给我看看组件怎么做的吗?
发表于 2023-12-23 21:41:00
求求,能看看组件怎么做么,有的细节不知道怎么做,比如那个完单率就不会弄
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

9回帖数 6关注人数 20903浏览人数
最后回复于:2023-12-23 21:41

返回顶部 返回列表