找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,极速登录

【2021夏季挑战赛】绍兴某旅游型综合酒店疫情分析报告

我是社区第406811位番薯,欢迎点我头像关注我哦~

      一、选手简介
       1、选手介绍

        团队名称:玛卡巴卡
        团队成员:

  • 小七:队长,就职于国内一家酒店管理软件公司,从事数据处理工作,负责整体取数规划和数据可视化呈现。
  • 小旭:甲方爸爸,某酒店集团运维工程师,被队长选中纯粹是为了用他们集团的门店经营数据,后负责所有的数据处理工作。自我评价:虽然人笨,但是不影响爱学习。
  • 小丁:邻居,中国美院学生,被队长拉来做仪表板美化,主要负责美。自我评价:卑微的设计狗。

      
        
        
      2、参赛初衷
        我们三人都没有数据分析的工作经验,我和小旭平时接触最多的就是数据库和服务器。因为对数据分析感兴趣,想看看自己跟圈内大神的差距有多少,我才有了参赛的想法。小旭公司之前上过别的BI产品,这次参加,也是想了解一下FineBI这款产品。小丁是一个艺术设计专业的学生,某天我在她家看到《数据价值与产品化设计》一书,惊讶于艺术专业居然也要学数据,她说现在的设计行业不仅仅局限于具体形态的物品设计,更多的是具有数据价值的产品化设计。所以,我们三人虽然都不在数据分析岗位上,但也想通过这次比赛了解各自感兴趣的地方。
        

      二、作品介绍
      1、背景
        武汉疫情对全国范围内的酒店行业都有不小的影响,某酒店管理软件公司拥有上万家酒店客户,除了个别大集团有自己的BI系统,其余绝大部分酒店都只能使用酒管软件自带的中国式复杂报表。原系统报表为按业务模块详细划分的一张张表格,将相关的多个数据块放在一张报表上体现已经比较困难,更无法让表格像图表一样进行直观地分析。
        本次数据分析以一家位于绍兴某旅游景区附近的酒店为例,用疫情前一年和后一年的经营数据,对比出酒店在哪些方面受疫情影响较大,结合疫情相关的政策,分析各时间段出现异常数据的可能原因,并给出一些建议以提升酒店的总收入。
        我们把数据脱敏和生成,通过传入参数控制,写成了通用了SQL脚本。我们所有的上万家酒店客户,只需要在酒店数据库上执行SQL脚本,将生成的数据通过excel导入到FineBI系统,更新一下业务包,仪表版就可直接出来该酒店的疫情分析报告,这是我们最大的推广价值。
      
      2、分析思路
        2.1
        本次分析的所有数据都以武汉封城这一天2020-01-23为分界线,往前往后各推365天进行分析。疫情前一年的数据区间为2019-01-23~2020-01-22,疫情后一年的数据区间为2020-01-23~2021-01-21。两个区间正好各自包含一次所有的法定节假日,可对比前后两年相同节假日的酒店经营情况。
        2.2
        酒店受疫情影响的大小,最终看的是对总收入的影响。
        总收入由房费、餐费等其他收入组成,对酒店前后两年各块收入进行对比,可以分析出主要是受哪块收入的影响较大。
        一般酒店房费是主要收入,而房费收入是受入住人数(出租率)、平均房价的影响,可以对疫情前后两年的平均出租率和平均房价进行对比。
        2.3
        如果酒店疫情前后的平均房价波动不大,那么影响房费收入的主要原因就是出租率,分析入住酒店的客人人数变化,即可得出相应的结论。
        2.4
        对各个维度(时间、地区、年龄段、性别、市场、渠道、协议客户等)进行入住人数、房晚数、人次指标的分析,结合疫情相关的政策,分析出现异常数据的可能原因,并给出一些建议以提升酒店的总收入。(维度和指标的含义写在第4块)
         
      3、数据处理
        3.1 企业授权,拿到企业的数据,进行数据脱敏和生成
        通过存储过程来生成,如果酒店需要用真实数据进行分析,最后两个参数传入’F’,’1’即可。
        我们对酒店的协议公司名字和经营数据进行了脱敏处理,整年的总收入、房费收入、出租房数、酒店客房总数等都乘以了一个相同的系数,所以分析报告上的酒店收入不是实际的收入,但是出租率和平均房价由于分子分母同时乘以了相同的系数,就不受影响。
        
         
        3.2生成6张表进行数据分析
        每个表的字段名已改成能表示具体含义的中文描述
        
         
        3.3 数据处理中较复杂的情况之一
        该酒店两年内有25万多条客人的入住信息,要根据客人的身份证号码,来分析各个省市入住该酒店的人数分布情况。
        根据网上最新的行政区划表,在数据库中关联客人的身份证号前2位得到省份,关联前4位得到城市,在FineBI里转化城市维度时,发现有145个城市匹配不上。
        检查发现,一些较老的身份证号码,还是早年的地区归属,比如有些身份证号在行政区划上对应的是四川省万县地区,现在应该是重庆万州区,都需要我们一一查验和匹配,这一步较费时。
        而我们的地区数据全国覆盖面较广较细,导致手工匹配时很慢很卡。
        后面我们把FineBI工具安装到配置更高的服务器上,145个匹配不到的城市整理到excel,excel里对照完成后更新数据,最终只剩下个别城市匹配不上,再手工关联即可。
         
        下图为手工填写的excel表格,145个匹配不上的城市,手工录入、查证更新。
        
        

        再用FineBI工具更新成最新的省份和城市。
        
         
        3.4 数据处理中较复杂的情况之二      
         对疫情后一年消费过的酒店协议客户做了RFM分析        
         统一口径:      
        1、剔除了疫情以后才开始跟酒店合作的公司客户,保证所有的公司均在疫情前就已在系统里建档。
        2、取疫情后一年在酒店有消费过的公司进行分析。
        3、某公司的2个员工去酒店入住,同住一间房,入住3天,那么三天内所发生的所有房费、餐费等算作单次消费额度;如果公司带团队来酒店开会,会有一个团队主账户,录入会议费、餐费等,也算作单次消费额度;如果公司入住(不管住几天)了10间房,有1个团队主账户,那么单次消费额度=总消费/11。
        4、本次分析的所有数据都以武汉封城这一天2020-01-23为分界线,往前往后各推365天进行分析,在计算客户距离最近的一次消费时间的间隔时,我们取的是距2021-01-21的时间差,疫情后一年的最后一天。
         
        这部分的自助数据集设置是最复杂的。
        
         
        3.5 其他一些注意事项
        3.5.1
        根据客源明细表取数分析时,把酒店的自用房和免费房剔除了,自用房如酒店经理值班所入住的房间,免费房如给酒管系统公司的工程师开的房间,这部分均不在分析范围内。
        3.5.2
        取数时踩过的几个坑:
        1、酒店的周末房价是指周五周六的房价,十一房价(10.1-10.7)是指9.30-10.6的房价,酒店系统里设置房价都是假期前一天开始设高。一开始取数时没有根据提前一天的日期关联,后修复。
        2、2020年国庆为10.1-10.8(10.1为中秋),为了做出对比,2020.9.30-10.2的平均数据算到中秋,9.30-10.7的平均数据算到国庆。取数时多了三条数据,第二年的中秋和国庆重叠了三条,后面除了节假日的分析,其余都做了过滤。
         
      4、可视化报告
        4.1颜色设置
        整个仪表板以深墨绿色为背景,以黄色和蓝绿色为主色调。
        黄色(分析的酒店集团LOG为黄色)代表疫情前一年的数据。
        蓝绿色(该酒店集团使用的酒店管理软件公司LOG为蓝绿色)代表疫情后一年的数据。
      
        4.2数据含义
        该数据可视化报告,主要是对酒店疫情前一年和后一年的收入、出租率、平均房价、入住人数、入住人次、房晚数进行对比分析。
        总收入=总房费+总餐费+其他各种酒店营业收入
        入住人数:
        一个房间入住2个客人,入住人数为2;如果10.1入住,10.3离店,那么10.1,10.2这两天的入住人数均为2。
        房晚数:
        房间卖出的个数,一个酒店300间客房,当晚入住200间,白天入住了20间钟点房(钟点房一般算0.5个房晚),那么该酒店当天的房晚数=200+20*0.5=210
        入住人次:
        客人的入住次数,1位客人10.1入住,10.3离店,只在10.1统计1个人次。
        出租率=总房晚数/酒店客房总数
        平均房价=总房费/总房晚数

       4.3分析报告
        一、酒店经营情况整体对比
        通过疫情前一年和后一年,酒店四大块收入的对比,得出疫情后一年酒店总收入的减少,主要是受房费收入的影响。
        而两年的平均房价变化不大,所以房费收入的减少主要还是出租率大幅下降的原因。
        通过对比境外客人的人数得知,虽然疫情后一年境外客入住人数大幅减少,但疫情前一整年也只有1052个境外客人,所以境外客人减少对酒店出租率的影响可不考虑,我们只用分析国内的入住客人情况。
        通过散团-房晚数对比,得知疫情后一年酒店接待的团队客人大幅减少,散客反而有轻微的增加。
        第一个模块,让我们确定,可以通过分析入住人数、房晚数、人次(该酒店长住客人基本没有,三个指标正相关)来得到酒店出租率->总房费->总收入下降的一些原因。
        
      
        二、出租率和平均房价变化趋势对比
        分析疫情前一年和后一年,相同月份/工作日/周末/节假日,出租率和平均房价的对比情况。
        为了区分,出租率用了折线图,平均房价用了散点图。
        
         
        三、客源分析
        分析了疫情前一年和后一年,每天的入住客人信息。对客人的省市、年龄段、性别分布做了对比,地图做了钻取。若酒店需要在某些平台做宣传,对目标客户的选择,根据分析出来的数据给出了一些建议。
        
        
      
        四、协议市场渠道分析
        酒店所使用的酒管系统,不管哪个酒店使用,市场码和渠道码都是必输项,只要客人在酒店入住,都有唯一的一个市场码和渠道码与之对应。
        市场码:客人的市场分类,比如上门散客、订房中心散客、旅行团、会议团、政府团、钟点房、免费自用房等等。
        渠道码:客人的渠道分类,比如通过电话预订、邮件预订、订房平台预订、旅行社客人、协议公司客人、直接上门等等。
        协议单位类型:公司(与酒店签协议价的公司、政府单位等)、订房中心(携程、飞猪等)、旅行社。这三大类也是系统写死的三大协议类,如果客人入住没有关联协议单位,一般是上门的散客、酒店的会员等。
        
      
        五、协议公司价值分析
        由上面的分析模块“各协议类型-房晚数占比”可以得知,疫情后一年公司类的占比明显下降了。
        订房中心和旅行社,是客人主动选择的预订渠道,而公司却是酒店销售员主动去签来的客源。
        所以最后这部分对疫情后一年到店消费过的协议公司做了RFM分析,对酒店应该维护和发展的公司客户给出了一些建议。
        

        4.4最终效果
仪表板-总.jpg

      三、参赛总结
        这次参赛总体来讲比较顺利。
        首先,队长之前学过FineBI工具,虽然平时工作中没有用到它,时间也隔得比较久了,但熟悉了一下立马上手。小旭负责数据准备,小丁负责仪表板美化,这两人之前都没有接触过FineBI工具,队长给培训了一下也立马就上手了。这也得益于FineBI工具的易操作性,当然队员也聪明^_^
        其次,队长公司的酒店管理软件做得比较好,数据表的各种约束(非空属性、唯一性约束等)、每天晚上系统过夜审时各种异常数据的检查处理、各种维度分析的数据按天转储,让我们基本上不用再做数据清洗,也不用根据最基础的业务表来重新取数。
        然后,小旭(队长的甲方爸爸)他们集团,各酒店门店的系统代码配置比较统一,员工操作比较规范,使我们用各种维度分析出来的结果,基本都与实际情况相符。但是,我们还是踩了一些坑,遇到了一些困难,最终小伙伴一起想办法解决了。
        最后,有几点使用FineBI的体会:
        1、FineBI有些功能设计还是比较好用的,比如某个组件需要换数据集,只要组件用到的字段名一致,直接替换数据集,图表的配置完全不用做修改。
        2、任何工具的使用,真的是一边踩坑一边了解它的运行逻辑。
        3、记得备份。


绍兴某旅游型综合酒店疫情分析报告.pdf (772.14 K)

发表于 2021-6-30 22:33:31
俩字:专业,绝活

使用道具 举报

发表于 2021-7-14 11:08:45
一个字:绝

使用道具 举报

发表于 7 天前
这团队组的好,各显所长!

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册  

本版积分规则

联系社区管理员|联系帆软|《帆软社区协议》|手机版|帆软社区|Copyright © 帆软软件有限公司 ( 苏ICP备18065767号-7 )

GMT+8, 2021-7-28 12:00 , Processed in 0.139814 second(s), 55 queries , Gzip On.

返回顶部 返回列表