【2023BI数据分析大赛】疫情后民宿消费变化分析
【2023BI数据分析大赛】疫情后民宿消费变化分析
一、选手简介
1、选手介绍
团队名称:星耀happy队
队长介绍:宋温暖,一枚数理思维强大却不耽搁可可爱爱的小姐姐,从事业务数据分析,擅长数据治理和挖掘,这次比赛主要承担数据处理和图表制作
成员介绍:MY,深耕零售行业10年+,从事商业分析,擅长商业战略分析和模型搭建,这次主要负责分析框架搭建和图表制作
2、参赛初衷
有机会可以选择了一个陌生领域深入了解,提升分析思维,学习大神的可视化操作,其次大赛奖励太诱人
二、作品介绍
1、业务背景
今年疫情放开后,旅游行业率先迎来复苏趋势,消费增长明显,上半年旅游消费逼近2019年的80%以上。细分到民宿的垂直行业,利好的增长趋势下,消费特征对比疫情期是否发生了变化?用户需求是否发生转移?供给结构是否随市场需求导向完成了升级?且因民宿产品类型为非标住宿,产品形态多以少库存和单库存呈现,面临暑期旺季是否可以提升效率承接住流量?作为某2C平台,以上问题分析成为现阶段为业务发展核心需求。
2、数据来源
2.1数据表简述:(因涉及到企业数据不便提供订单类明细表均呈现聚合类数据,另用户及房源占比数据均以等比例方式进行数据量缩减脱敏)
A聚合表:
1)城市聚合数据表:为汇总层数据包含房源信息、用户量信息、产出信息、以及市占率数据
具体字段:分别是城市维度2019年和2023年的房源数、用户数、间夜数、GMV、点评数、友商点评数、ADR(间夜价)
2)市场数据表:包含住宿市场供给、产量等规模数据
具体字段:分别是销售额、房源量、入住率
B维度表:
1)用户维度表:包含预定用户的基本信息
字段包含:年份、用户id、年龄、出行城市、居住地、是否异地、出行人数(时间取自2019年和2023年6月数据)
2)商户维度表:包含平台运营商户的基本信息
字段包含:年份、商户id、年龄、经营时长、库存数
3)房型维度表:包含平台可售卖房型的基本信息
字段包含:年份、房型id、房屋类型、展示价格、居室数
2.2 数据获取:
1) 市场类外部数据取自前瞻产业研究院以及企业内部调研项目数据(数据来源:2023-2028年 中国民宿行业市场前景预测与投资战略规划分析报告)
2) 企业内部数据调取数据库明细类数据后进行脱敏处理
2.3数据脱敏:
1)由于民宿数据庞大,本次分析按年度随机提取一定比例的房型、房东、用户数据,对于ID等敏感信息均进行了脱敏处理
2)部分代码展示:
2.4 数据处理:数据表上传后,根据finebi分析场景增加数据表字段的计算处理、分组汇总处理,以及在分析过程中进行赋值处理。(较为简单的数据表处理此处不做过多赘述)
3、指标说明
指标释义:
业务模块
指标
释义
P1:企业经营现状
市场规模
市场交易总额
GMV
交易金额
GMV同比增长率
2023年6月gmv同比2019年6月gmv增长比例
房源量
企业平台在线且可售卖的房源数量
房源同比增长率
2023年6月平均在线可售卖房源量同比2019年6月均值的增长比例
流量
访问平台房源列表页去重用户数
流量同比增长率
2023年6月访问当前在线房源列表页去重用户数同比2019年6月的增长比例
ADR
间夜价,即每晚房源平均售价
ADR同比增长率
2023年6月平均间夜价同比2019年6月平均间夜价增长比例
P2:产业链特征变化
价格带
间夜价按照一定的间隔分布
库存数
单个房源最小单位sku
本异地
用户id归属判断
P3:暑期分析预测
市占率
企业产单/共享民宿产单,此处下钻到城市市占率由各平台企业订单点评数量进行估算
房源同比增长率
同上
4、分析思路
确定选题后,我们首先从今年的行业及企业现状判断、其次供需两端消费变化、最后结合变化预测增量制定运营策略三方面进行拆解,具体思路见下:
行业及企业经营现状
通过漏斗模型判断该企业在整个住宿行业的体量占比,确定机会还有多大,进而分析该企业经营现状对比疫情前是否良性增长,同时下钻至城市维度,分析城市热度;
供需两端消费变化
疫情3年市场倒逼清退了一批低端产品,用户需求较疫情前更为多元,疫情放开后供给端和需求端的分布及增长发生变化,故从房屋、房东和用户三个维度出发分析特征属性;
暑期运营策略
最后结合上面分析的特征,基于暑期运营背景,利用波士顿模型分析市场供需,预测旺季增速和缺口,制定暑期运营策略;
5、可视化报告
5.1 看板构思
5.2 报告展示
P1 企业经营现状:
1.自2010年以来,共享住宿(简称民宿)市场发展成为百亿量级行业,但从更广泛的短租住宿市场角度来看,民宿市场的潜力仍然巨大,目前的市场渗透率仅为10%。
2.进一步深入分析,发现X企业在民宿市场中的份额约为27%,这与疫情前(2019年6月)相比,虽然供应端出现了一定的下降,但销售额和流量都呈近一倍以上的增长。
3.下钻到城市,热门城市仍集中在北上两地、成都重庆西安新一线旅游城市,以及青岛威海秦皇岛季节性目的地城市。值得注意的是对比疫情期,新疆(喀什)、云南(西双版纳)、山东(威海)、河北(秦皇岛)热度增幅异常高,成为今年黑马城市。
P2 三维分析:
房屋侧:供给侧房源以200-400元以内的酒店式公寓和普通公寓类产品为主;疫情加速清出一批低端普通公寓,中高端(600元以上)产品供给出现增长,同时多人出行场景增长明显。
房东侧:目前民宿经营者多以80后居多,对比疫情前,更多的90后也加入赛道,且经过疫情的洗礼,更多的多库存且经营时长超3年以上的专业经营者崭露头角。
用户侧:今年出行用户仍多以8090后居多,个性需求升级,对比疫情前95后跨省游需求增长明显,北上广成的流向吞吐量最为集中。
P3暑期预测分析:
1. 根据波士顿矩阵模型判断,X企业在季节性目的地城市的市占率超一半以上,而在北上广深成等城市民宿市占劣势,暑期流量增长的同时,供给严重不足;
2. 利用历史流量和房源数据,预测暑期流量和房源GAP,进而定位到不同城市价格带的供给缺口,为运营提供决策及目标。
P4指导策略:
5.3报告全局总览
三、参赛总结
1、FineBI工具
整体:出乎意料的好用,操作灵活,功能齐全
亮点:
①函数与Excel和SQL相近,且有的函数实操性很强,如:sum_agg()
②左合并的功能也很方便,轻松实现表连接
③协作功能真的很赞,大大提升了共同创作的效率
吐槽:
①无法格式复用,当替换指标的时候需要重新设置格式
②本地数据更新时,需重新上传,无法覆盖数据进而更新组件
2、参赛总结
思路总结:本次分析包含现状分析,维度分析,预测分析和指导策略四部分,以可落地的运营动作为目的,贯穿分析方向。
心路总结:
很幸运有机会深度使用FineBI,常年与数据打交道,经常没时间搞数据美化,借此良机深感数据之美。希望以后我们做更有温度的数据分析师,而后产出的作品可以既实用又艺术。
感恩我的小伙伴带我参赛,与我并肩作战,共同成长。