【2021夏季挑战赛】绍兴某旅游型综合酒店疫情分析报告
恭喜本作品荣获“2021帆软BI可视化夏季挑战赛-最佳行业应用奖”
1、点击浏览在线作品
2、点击查看/编辑在线模板(完成问卷即可获取平台账号)
帆软专家点评:
选取酒店管理期间的真实数据,站在业务人员视角代入业务背景去思考,分析思路严谨,拆解透彻,能够看出对于业务的认知程度和对数据的把握能力非常强,给人以充分的启发性。同时围绕问题展开思考和分析的框架特别轻巧经典,其中的价值分析也做了充分的思考和解读,非常接地气。最后,对于可视化图表、整体布局颜色搭配也把握不错,是一份非常专业实用的分析作品。
一、选手简介
1、选手介绍 团队名称:玛卡巴卡 团队成员:
小七:队长,就职于国内一家酒店管理软件公司,从事数据处理工作,负责整体取数规划和数据可视化呈现。
小旭:甲方爸爸,某酒店集团运维工程师,被队长选中纯粹是为了用他们集团的门店经营数据,后负责所有的数据处理工作。自我评价:虽然人笨,但是不影响爱学习。
小丁:邻居,中国美院学生,被队长拉来做仪表板美化,主要负责美。自我评价:卑微的设计狗。
2、参赛初衷 我们三人都没有数据分析的工作经验,我和小旭平时接触最多的就是数据库和服务器。因为对数据分析感兴趣,想看看自己跟圈内大神的差距有多少,我才有了参赛的想法。小旭公司之前上过别的BI产品,这次参加,也是想了解一下FineBI这款产品。小丁是一个艺术设计专业的学生,某天我在她家看到《数据价值与产品化设计》一书,惊讶于艺术专业居然也要学数据,她说现在的设计行业不仅仅局限于具体形态的物品设计,更多的是具有数据价值的产品化设计。所以,我们三人虽然都不在数据分析岗位上,但也想通过这次比赛了解各自感兴趣的地方。 二、作品介绍 1、背景 武汉疫情对全国范围内的酒店行业都有不小的影响,某酒店管理软件公司拥有上万家酒店客户,除了个别大集团有自己的BI系统,其余绝大部分酒店都只能使用酒管软件自带的中国式复杂报表。原系统报表为按业务模块详细划分的一张张表格,将相关的多个数据块放在一张报表上体现已经比较困难,更无法让表格像图表一样进行直观地分析。 本次数据分析以一家位于绍兴某旅游景区附近的酒店为例,用疫情前一年和后一年的经营数据,对比出酒店在哪些方面受疫情影响较大,结合疫情相关的政策,分析各时间段出现异常数据的可能原因,并给出一些建议以提升酒店的总收入。 我们把数据脱敏和生成,通过传入参数控制,写成了通用了SQL脚本。我们所有的上万家酒店客户,只需要在酒店数据库上执行SQL脚本,将生成的数据通过excel导入到FineBI系统,更新一下业务包,仪表版就可直接出来该酒店的疫情分析报告,这是我们最大的推广价值。 2、分析思路 2.1 本次分析的所有数据都以武汉封城这一天2020-01-23为分界线,往前往后各推365天进行分析。疫情前一年的数据区间为2019-01-23~2020-01-22,疫情后一年的数据区间为2020-01-23~2021-01-21。两个区间正好各自包含一次所有的法定节假日,可对比前后两年相同节假日的酒店经营情况。 2.2 酒店受疫情影响的大小,最终看的是对总收入的影响。 总收入由房费、餐费等其他收入组成,对酒店前后两年各块收入进行对比,可以分析出主要是受哪块收入的影响较大。 一般酒店房费是主要收入,而房费收入是受入住人数(出租率)、平均房价的影响,可以对疫情前后两年的平均出租率和平均房价进行对比。 2.3 如果酒店疫情前后的平均房价波动不大,那么影响房费收入的主要原因就是出租率,分析入住酒店的客人人数变化,即可得出相应的结论。 2.4 对各个维度(时间、地区、年龄段、性别、市场、渠道、协议客户等)进行入住人数、房晚数、人次指标的分析,结合疫情相关的政策,分析出现异常数据的可能原因,并给出一些建议以提升酒店的总收入。(维度和指标的含义写在第4块) 3、数据处理 3.1 企业授权,拿到企业的数据,进行数据脱敏和生成 通过存储过程来生成,如果酒店需要用真实数据进行分析,最后两个参数传入’F’,’1’即可。 我们对酒店的协议公司名字和经营数据进行了脱敏处理,整年的总收入、房费收入、出租房数、酒店客房总数等都乘以了一个相同的系数,所以分析报告上的酒店收入不是实际的收入。 3.2生成6张表进行数据分析 每个表的字段名已改成能表示具体含义的中文描述 3.3 数据处理中较复杂的情况之一 该酒店两年内有25万多条客人的入住信息,要根据客人的身份证号码,来分析各个省市入住该酒店的人数分布情况。 根据网上最新的行政区划表,在数据库中关联客人的身份证号前2位得到省份,关联前4位得到城市,在FineBI里转化城市维度时,发现有145个城市匹配不上。 检查发现,一些较老的身份证号码,还是早年的地区归属,比如有些身份证号在行政区划上对应的是四川省万县地区,现在应该是重庆万州区,都需要我们一一查验和匹配,这一步较费时。 而我们的地区数据全国覆盖面较广较细,导致手工匹配时很慢很卡。 后面我们把FineBI工具安装到配置更高的服务器上,145个匹配不到的城市整理到excel,excel里对照完成后更新数据,最终只剩下个别城市匹配不上,再手工关联即可。 下图为手工填写的excel表格,145个匹配不上的城市,手工录入、查证更新。 再用FineBI工具更新成最新的省份和城市。 3.4 数据处理中较复杂的情况之二 对疫情后一年消费过的酒店协议客户做了RFM分析 统一口径: 1、剔除了疫情以后才开始跟酒店合作的公司客户,保证所有的公司均在疫情前就已在系统里建档。 2、取疫情后一年在酒店有消费过的公司进行分析。 3、某公司的2个员工去酒店入住,同住一间房,入住3天,那么三天内所发生的所有房费、餐费等算作单次消费额度;如果公司带团队来酒店开会,会有一个团队主账户,录入会议费、餐费等,也算作单次消费额度;如果公司入住(不管住几天)了10间房,有1个团队主账户,那么单次消费额度=总消费/11。 4、本次分析的所有数据都以武汉封城这一天2020-01-23为分界线,往前往后各推365天进行分析,在计算客户距离最近的一次消费时间的间隔时,我们取的是距2021-01-21的时间差,疫情后一年的最后一天。 这部分的自助数据集设置是最复杂的。 3.5 其他一些注意事项 3.5.1 根据客源明细表取数分析时,把酒店的自用房和免费房剔除了,自用房如酒店经理值班所入住的房间,免费房如给酒管系统公司的工程师开的房间,这部分均不在分析范围内。 3.5.2 取数时踩过的几个坑: 1、酒店的周末房价是指周五周六的房价,十一房价(10.1-10.7)是指9.30-10.6的房价,酒店系统里设置房价都是假期前一天开始设高。一开始取数时没有根据提前一天的日期关联,后修复。 2、2020年国庆为10.1-10.8(10.1为中秋),为了做出对比,2020.9.30-10.2的平均数据算到中秋,9.30-10.7的平均数据算到国庆。取数时多了三条数据,第二年的中秋和国庆重叠了三条,后面除了节假日的分析,其余都做了过滤。
4、可视化报告
4.1颜色设置
整个仪表板以深墨绿色为背景,以黄色和蓝绿色为主色调。
黄色(该酒店集团的LOG为黄色)代表疫情前一年的数据。
蓝绿色(该酒店使用的酒店管理软件公司的LOG为蓝绿色)代表疫情后一年的数据。
4.2数据含义
该数据可视化报告,主要是对酒店疫情前一年和后一年的收入、出租率、平均房价、入住人数、入住人次、房晚数进行对比分析。
总收入=总房费+总餐费+其他各种酒店营业收入
入住人数:
一个房间入住2个客人,入住人数为2;如果10.1入住,10.3离店,那么10.1,10.2这两天的入住人数均为2。
房晚数:
房间卖出的个数,一个酒店300间客房,当晚入住200间,白天入住了20间钟点房(钟点房一般算0.5个房晚),那么该酒店当天的房晚数=200+20*0.5=210
入住人次:
客人的入住次数,1位客人10.1入住,10.3离店,只在10.1统计1个人次。
出租率=总房晚数/酒店客房总数
平均房价=总房费/总房晚数
4.3分析报告 一、酒店经营情况整体对比 通过疫情前一年和后一年,酒店四大块收入的对比,得出疫情后一年酒店总收入的减少,主要是受房费收入的影响。 而两年的平均房价变化不大,所以房费收入的减少主要还是出租率大幅下降的原因。 通过对比境外客人的人数得知,虽然疫情后一年境外客入住人数大幅减少,但疫情前一整年也只有1052个境外客人,所以境外客人减少对酒店出租率的影响可不考虑,我们只用分析国内的入住客人情况。 通过散团-房晚数对比,得知疫情后一年酒店接待的团队客人大幅减少,散客反而有轻微的增加。 第一个模块,让我们确定,可以通过分析入住人数、房晚数、人次(该酒店长住客人基本没有,三个指标正相关)来得到酒店出租率->总房费->总收入下降的一些原因。 二、出租率和平均房价变化趋势对比 分析疫情前一年和后一年,相同月份/工作日/周末/节假日,出租率和平均房价的对比情况。 为了区分,出租率用了折线图,平均房价用了散点图。 三、客源分析 分析了疫情前一年和后一年,每天的入住客人信息。对客人的省市、年龄段、性别分布做了对比,地图做了钻取。若酒店需要在某些平台做宣传,对目标客户的选择,根据分析出来的数据给出了一些建议。 四、协议市场渠道分析 酒店所使用的酒管系统,不管哪个酒店使用,市场码和渠道码都是必输项,只要客人在酒店入住,都有唯一的一个市场码和渠道码与之对应。 市场码:客人的市场分类,比如上门散客、订房中心散客、旅行团、会议团、政府团、钟点房、免费自用房等等。 渠道码:客人的渠道分类,比如通过电话预订、邮件预订、订房平台预订、旅行社客人、协议公司客人、直接上门等等。 协议单位类型:公司(与酒店签协议价的公司、政府单位等)、订房中心(携程、飞猪等)、旅行社。这三大类也是系统写死的三大协议类,如果客人入住没有关联协议单位,一般是上门的散客、酒店的会员等。 五、协议公司价值分析 由上面的分析模块“各协议类型-房晚数占比”可以得知,疫情后一年公司类的占比明显下降了。 订房中心和旅行社,是客人主动选择的预订渠道,而公司却是酒店销售员主动去签来的客源。 所以最后这部分对疫情后一年到店消费过的协议公司做了RFM分析,对酒店应该维护和发展的公司客户给出了一些建议。 4.4最终效果145606 三、参赛总结 这次参赛总体来讲比较顺利。 首先,队长之前学过FineBI工具,虽然平时工作中没有用到它,时间也隔得比较久了,但熟悉了一下立马上手。小旭负责数据准备,小丁负责仪表板美化,这两人之前都没有接触过FineBI工具,队长给培训了一下也立马就上手了。这也得益于FineBI工具的易操作性,当然队员也聪明^_^ 其次,队长公司的酒店管理软件做得比较好,数据表的各种约束(非空属性、唯一性约束等)、每天晚上系统过夜审时各种异常数据的检查处理、各种维度分析的数据按天转储,让我们基本上不用再做数据清洗,也不用根据最基础的业务表来重新取数。 然后,小旭(队长的甲方爸爸)他们集团,各酒店门店的系统代码配置比较统一,员工操作比较规范,使我们用各种维度分析出来的结果,基本都与实际情况相符。但是,我们还是踩了一些坑,遇到了一些困难,最终小伙伴一起想办法解决了。 最后,有几点使用FineBI的体会: 1、FineBI有些功能设计还是比较好用的,比如某个组件需要换数据集,只要组件用到的字段名一致,直接替换数据集,图表的配置完全不用做修改。 2、任何工具的使用,真的是一边踩坑一边了解它的运行逻辑。 3、记得备份。绍兴某旅游型综合酒店疫情分析报告.pdf (772.14 K)
编辑于 2021-8-9 22:48 编辑于 2021-8-9 22:50