一、选手简介
1、选手介绍
个人介绍:
帆软社区用户名:迅哥小黑(uid:220372),真实姓名:梁志伟。目前就职于苏州共营互联网科技有限公司。我司是教育培训行业的,目前从事数据分析工作,个人对数据分析和数据可视化比较感兴趣,所以参加了这一次的比赛。虽然这一次是个人参加,但还是取了一个团队名称——贝塔之星。
个人照片:
2、参赛初衷
因为在平时的工作中也会经常使用到FineBI这个不错的工具。所以想通过比赛实践提升BI工具的使用方法和技巧。同时在这里也能和更多的FineBI大神交流学习,互相探讨共同进步,这对于今后的工作都是大有裨益的。当然了大赛丰厚的奖励也是十分吸引人。
二、作品介绍
1、业务背景及需求
通过分析浙江省某市2022年劳动节和2023年劳动节期间的旅游数据,找出存在的问题,并结合游客画像特征以及旅游偏好,给出相应的营销建议,以推动当地旅游业的增长。
2、数据来源
本次作品使用大赛官方提供的浙江省某市的旅游数据。之所以选择这个数据主要是因为现在国家的政策方针是大力恢复和发展国民经济。而旅游就是很好的刺激消费,拉动经济的手段,就像淄博烧烤和贵州村超一样,带动经济的同时也能提高人民的幸福感。
3、分析思路
3.1、整体情况
首先根据业务背景和提供的数据特征,优先确定核心指标,本报告选取三个指标,分别是:旅游总收入,旅游总人数和人均旅游景点数。通过2023年和2022年劳动节期间的数据对比,发现目前存在的问题。
3.2、分析维度拆解
由于分析的目的是为了推动旅游业的增长,因此核心指标选择旅游收入,同时维度拆解选择景点和购票渠道这两个。这是因为旅游分析,景点是重点,同时渠道分析也是必不可少的。
3.3、游客画像及满意度
首先想到的是游客的基础信息,选择性别和年龄。然后是分析游客的旅游偏好,包括:景点的业态类型,出行方式以及是否跟团。最后是游客的满意度情况,因为在推动旅游收入增长的同时也要提高游客的满意度。
3.4、景点分析
旅游的重点是景点,所以本报告对景点做了单独的分析。主要是两个方面:第一是景点的关联性分析。因为如果想推动旅游业的增长,那么应该让游客游玩更多的景点,那么景点之间的关联性分析就显得十分重要,所以第一时间就想到了经典的“购物篮”分析,这样就能为景点推荐提供数据支撑。第二是景点的象限分析,本报告选取两个重要维度:人均收入和满意度。目的是找出标杆性的景点,这样可以将标杆景点的宝贵经验复制到其他景区,这样就能吸引更多的游客。
3.5、结论与建议
根据数据分析的结果,首先发现目前浙江省某市旅游业存在的问题,然后根据可视化的图表数据得到主要结论,然后根据这些结论提出针对性的建议。
整体的分析思路框架见下面的脑图:
4、数据处理
1、原始数据筛选:从原始的旅游数据中筛选10个景点的数据,具体景点名称为:人民剧院,奇妙世界,南山,杜甫故居,大慈寺,李白故居,玻璃房,野生动物园,太阳岛和南山古镇。最终导入系统的数据共计32768条。
2、日期处理:首先将日期变为文本型,然后新增旅游时段,分别为 2023年劳动节和2022年劳动节。
3、旅游总收入:新增旅游总收入字段,其值为原始三项收入之和。
旅游总收入=主门票收入+副门票及周边收入+餐饮收入
4、年龄处理:新增年龄区间字段,将原始的年龄划分为5个区间段:18岁以下,18-30岁,31-40岁,41-50岁和51岁及以上。
5、获取景点业态类型:通过左右合并获取景点业态类型的数据,关联的字段是景点名称。
通过以上数据预处理,我们得到整理后的数据,后面的可视化分析就是根据这个数据来进行,更多的数据集处理也会在可视化报告这一环节详细阐述。
5、可视化报告
5.1、整体情况
整体情况这里主要使用指标卡组件进行展示,其中旅游总人数是对客户进行去重计数,因为一个客户会游玩多个景点。通过数据我们发现2023年劳动节期间的旅游总收入和旅游总人数高于2022年,但是人均旅游景点数还是比较低的。这也是推动旅游增长很好的切入点,接下来就是通过数据分析的结果给出提高人均旅游景点数的建议。
5.2、景点和购票渠道旅游收入情况
首先是景点的收入对比情况,在制作的过程遇到的问题就是旅游收入和占比的处理,如果直接使用快速计算的占比,就不能按照2023年和2022年分开计算。因此需要在数据集里面进行处理,其主要的思路是先将2022和2023年旅游总收入计算出来,然后根据旅游时段进行关联,得到收入总值,然后再计算各景点占比情况。具体如下图:
在分析不同渠道收入情况的时候,首先想到的就是通过帕累托图来展示,这样很容易看出主要渠道的占比情况。在这里可以直接使用函数计算,得到渠道收入的累计占比情况。这一点还是十分方便的。先计算累计旅游收入,最后计算累计占比。
通过可视化的结果我们得出如下结论:
1、景点旅游收入排名前三的分别是人名剧院,奇妙世界和南山。
2、美团和马蜂窝购票的客户带来的旅游收入明显高于其他渠道。后面的建议也是参考了这一结论。
5.3、游客画像和满意度分析
游客画像特征主要选取性别和年龄,在分析男女性别差异的时候,使用了TGI指数的概念,结果发现2023年相对于2022年,男女性别比例并没有太大变化,处于比较均衡的状态。在年龄方面,游客的年龄主要集中在18-30岁,51岁及以上的游客占比有增加趋势。考虑到未来老龄化的发展,景点可以考虑推出一些适合老年人的服务。
游客的旅游景点业态类型主要是人文景观和主题公园。大部分游客类型是散客,占比达到70%,但是游客的出行方式最多的是大巴,自驾的游客并不多。这一点也为后面的建议提供了思路。
在展示游客满意度的时候,考虑到满意度有三个方面,所以选择了雷达图。结果发现2023年游客的满意度要略低于2022年,这一点还是值得注意的,提高游客的满意度也是今后工作的一个方向。
5.4、景点关联性及散点分布分析
我们使用经典的“购物篮”分析来表示景点的关联性。我们选取2022年和2023年游玩的景点数大于等于4的游客作为样本来考察景点之间的关联性。这里使用提升度作为景点关联推荐的依据。其计算公式如下:
其中支持度的计算公式如下:
通过结果我们发现提升度大于1的关联景点有奇妙世界和大慈寺,玻璃房和南山古镇。
在分析景点的散点分析时,我们选取两个维度:人均收入和总体满意度。其中:
人均收入=旅游总收入/游客数
总体满意度=(服务满意度+项目满意度+环境满意度)/3
通过散点图可知,奇妙世界不仅人均收入最高,总体的满意度也是最高的,该景区的成功经验值得其他景区学习。
5.5、相关建议
结合业务背景需求和数据分析得出的问题以及结论,本报告的建议主要围绕提高人均旅游景点数,通过这一举措来推动浙江省A市的旅游增长,具体的建议如下:
1、与美团和马蜂窝平台合作,尝试推出大慈寺和奇妙世界,南山古镇和玻璃房的优惠组合门票,以此提高人均旅游景点数,增加A市旅游收入。
2、与A市的旅行社合作,可以推出跟团旅游的优惠政策,例如提供免费大巴接送的服务。
3、逐步完善A市景点之间的公共交通路线,例如开通景点之间直达公交。
4、深入了解并解决游客在旅行过程中遇到的问题,提高游客的满意度,提升A市的旅游形象。
本次使用大赛公共账号进行仪表板制作,在此附上公共链接: https://bisolutions.fanruan.com/webroot/decision/link/IZFf
最终作品预览:
附件:作品视频介绍如下:
浙江省A市旅游分析报告-视频介绍-梁志伟.rar (20.42 M)
三、参赛总结
1、FineBI工具
我觉得FineBI这款工具还是很不错的,从制作本报告的帕累托图和“购物篮”分析中,我可以明显感受到很方便。同时对于数据分析的价值也有自己的思考,虽然这次采用大赛提供的旅游数据,数据本身也不是很复杂,但是能从中发现问题,并且能够从数据分析中找到解决这个问题的方法,我觉得这是数据分析的价值所在,同时也是魅力所在。
2、参赛总结
这是我第一次参加帆软的BI数据分析大赛,在制作分析报告的过程也遇到了很多问题,例如之前用的是5.1版本,现在是6.0版本,一开始有点不适应,不少功能都没有找到,后来通过自己摸索和在群里询问都得到了解决。同时整个过程中也是让自己不断地去思考问题,锻炼了自己的思维,在遇到一个难点的时候,会去查看相应的文档。通过这次比赛也让自己学习到很多,也希望这样的比赛能够越办越好,可以向更优秀的人学习成长。
|