【2023BI数据分析大赛】携程网热门地点机票数据分析

我是社区第2219149位番薯,欢迎点我头像关注我哦~

一. 团队介绍

1.      团队名称:精益求精

2.      成员介绍:

杨易鑫:队长,现就读与西安培华学院智能科学与信息工程学院,学习软件工程专业,目前着重于数据可视化,数据开发等学习,熟练FineBiFineReport,考取FCBAFCRA等相关技能证书,在本次比赛中负责数据清洗,Bi可视化与文档撰写。

陈学森:队员,现就读于西安培华学院只能科学与信息工程学院,学习软件工程专业,目前着重于Java开发,数据库应用与设计等学习,熟练MysqlOracleDB2等不同类型数据库,考取HCIA等相关证书,在本次比赛中负责数据采集,了解项目知识,构建多维度分析角度。

3.      参赛初衷:

对于热爱数据分析的我们来说,比赛可以让我们更好的提升自己,通过完成比赛来获得更多技术上的进步与思考问题的方式,锻炼自己的数据分析和决策支持能力,并学习如何有效地传达数据的解和洞察为以后的学习和工作中积累经验,并且我们相信自己可以利用FineBi的特性来创建出色的数据可视化作品,提高自身价值与软件价值,同时我也希望通过比赛,促进团队合作,参赛培养团队合作精神和协作能力。

二. 作品介绍

1.      业务背景:

随着航空业的快速发展,机票预订平台成为人们购买机票的主要渠道之一。携程作为中国领先的在线旅游平台,拥有庞大的用户群体和海量的机票数据。这些数据包含了用户的搜索、预订和购买行为信息,以及航班的价格、时刻表和航空公司等相关信息。携程机票数据分析的目标是通过对这些数据的深入挖掘和分析,为携程平台和航空公司提供有价值的商业洞察,从而优化运营策略、提升用户体验和增加利润。

2.      数据来源:

数据爬取自携程网机票411-59日热门城市的机票信息,主要包含两个项目表。机票数据表和具体日期机票价格

3.      分析思路:

    分析维度

,全局分析:这个分析维度主要关注整体的航空市场情况,包括航空公司的总数,出发城市总数,到达城市总数等。

.地理位置&客机飞行时间:这个分析维度主要考虑起飞和降落的地理位置以及客机的飞行时间。通过地理位置分析可以了解航空公司的飞行网络覆盖范围,以及旅客的流动趋势和需求。飞行时间是指客机从起飞到降落所花费的时间,可以用来衡量航线的快速程度和航班的效率。

.航空公司类型:这个分析维度考虑航空公司的不同类型,如中国国家航空公司、东方航空公司、海南航空公司等。通过分析不同类型的航空公司,可以了解不同公司的经营策略、定位和目标客户群,并评估其竞争优势和市场地位。

.客舱类型:这个分析维度关注不同客舱类型,如头等舱、商务舱、经济舱等。通过分析不同客舱类型的市场需求和乘客偏好,航空公司可以定位不同客户群,制定差异化的服务和营销策略。

.旅途量:这个分析维度关注旅途量,即旅客在特定时间段内的航空出行量。通过分析旅途量,航空公司可以了解市场的规模和潜力,并根据需求进行航线规划和航班安排,以提供更好的服务和满足乘客的需求。

    分析方法

数据收与整理:收集携程网4-5月热门城市,包括地理位置、航班数量,航空公司数量等信息,并进行整理和清洗,确保数据的准确性和一致性。

数据可视化:利用数据可视化工具,如地、图表等将收集到的数据进行可视化展示,以便更直观地分析和比较各个旅游地的特和指标。

统计分析:运用统学方法对数据进行析,比如计算平均值、极值、相关系数等,以揭示各地区的差异和关联性。

空间分析:利用地理信息系统(GIS)技术,对旅游地的地理位置和空间分布进行分析,包括地理热力图,以现旅游地空间模式和趋势。

通过以上综合分析,航空公司可以了解市场的整体情况和竞争环境,识别潜在的市场机会和需求变化,并根据不同分析维度制定相应的战略和决策。

     分析框架

4.      数据处理:

数据处理所使用的工具

Pycharm2022mysql8.0Datagrip2021FineBi6.0

    数据来源

 

如上图

    读取数据

在使用FineBi6.0连接数据库是,发现软件自带的是mysql5.7的驱动,所以重新下载驱动配置好后连接成功数据库,接着读取数据库中的数据。

 

 

    数据清洗

        爬取的过程中将客机号与客机类型没有分开,在FineBi中选择字段拆分,根据分隔符空格拆分,将其拆为客机航班号和客机类型两列,然后新增公式列,通过抵达时间减去出发时间计算出持续时间,也就是飞行所需时间。

 

 

 

然后根据它的飞行时间新增赋值列,在0-2小时内属于短途飞行,2-4小时属于中途飞行,4小时以上属于长途飞行。

 

 

    使用新增公式列修改字段类型,机票数据表中的机票价格为文本类型,使用replace将文本中的,和¥符号替换,得到新的机票价格数值列。

 

 

到此数据的处理已经结束,接下来进行可视化图标制作。

5.      可视化报告:

    制作总航班信息的KPI指标卡,在图表类型中选择KPI,将字段拖拽到文本中,得到出发城市总量,到达城市总量,出发机场总数,到达机场总数以及航班总数,通过展示可以很清楚的看到在两个月期间,我国热门城市航班出行量出大。

    制作总城市记录图,因为设计维度有两个选项,分别是出发城市和到达城市,所以选择分组表,将维度添加后添加记录总数为指标,为了区别明显在记录数指标中添加数据条,因为仪表盘背景选择为深色,在色彩搭配方面选择蓝色表格背景,数据条则为显眼的灰色,然后通关关联可以查看出发城市相对应的到达城市以及他们的记录数。

.通过分组表可以看出北京作为首都,不论出行原因,北京的航班出行量需求和进航量都高于其它热门市区,属于高进高出,流动人口极大。

.仅此于北京出行量的深圳乘客大多选择到达北京,可以适宜开设其它航次。

.上海的进航量极大,但是出行量较少,属于低出高进。

    制作航班飞行时间热力图,将到达城市添加地理角色经度与维度,然后选择放入对应的横纵轴,在大小的设置上添加记录数,标签显示上采取快速计算字段飞行耗时时间,这样子既可以在地图上通过热力大小直观的看出热门城市的进航量也可以通过标签的数字准确的得到各出发城市到到达城市的平均飞行时间。

.可以看出沿海城市航班数较为密集,内陆虽然零散,但是却所占班次较多。

.各地到深圳平均时间最长,约197分钟,到青岛平均时间最短为97分钟。

    制作航空公司航班数占比图与客机机型矩形树图,在占比图的制作过程中,将记录数作为占比依据,进行占比处理,标签的选择航空公司名称,这样子既可以直观的看出各航空公司占总数的比例,矩形数图选择将客机机型作为标签,显示出各种机型在所有航线中使用情况并将总记录数作为大小的判别依据。

.通过占比图可以直观的看出,乘客选择国航,南航与厦门航空较多,此三种航空公司有着不错的顾客数,可以增加更多的航班数。

.通过矩形数图可以看出空客320(中),空客330(大),空客321(中)是乘客选择较多的机型,说明在一些主管因素下这些航班有优势性,后面可以继续增加此三种机型的航班任务。

    制作航空公司机票价格条形图,出行日期与价格的折线图,将处理好的价格进行平均值计算,与航空公司维度和日期维度分别构成条形,折线图,在条形图的制作中采用颜色区分航空公司,折线图中添加过滤条件,选取航班数较多的三家航空公司进行比较,同时使用颜色进行区分。

.通过条形图可以看出四川航空平均价格远高于其它航空,而多彩航空票价较为实惠,价格最低,国内4-5月平均航班票价在1600-1300之间。

.411-421日以及5月中旬后,三家航空公司平均价格基本增减幅度处于均势,在421-5月中上旬,有较明显的涨幅趋势,在有节假日的情况下,航空公司会根据乘客数量进行价格调整,所以乘客购买机票可以避开节假日去购买能有更合适的价格。

    制作客舱数与航空公司分区柱形图与客舱总占比图,在图示选择上,因为客舱含有经济舱与公务舱,所以采取分区图的形式展现,使用颜色区分航空公司,客舱数为总记录数,占比图的制作中采用占比计算,标签为计算结果与客舱类型。

.根据占比数量可以看出,四川航空的公务舱乘客较多,这也在侧面反映刚刚四川航空的平均价格贵的原因,四川航空可以加强公务舱建设,提高服务质量,保持公务舱乘客人员数量,在经济舱的图示中,可以看出南航,国航,厦门航空与东方航空数量较多。

.4-5月出行,总体乘客以经济舱为主,大多为游客属性,公务舱类型较少,只占3.76%,可以更多的加强经济舱的服务质量,为庞大的乘客团体提供更好的服务。

    旅途类型统计和旅途类型占比图,旅途类型采用对比树状图,根据飞行时间将类型值分别划分为短途,中途,长途,维度选取航空公司,采用颜色来区分旅途的类型,占比图中进行各旅途在总记录数的占比计算,采用计算值为角度。

.各个航空公司中中途占比最高,南航,国航,厦门航空以及东方航空可以更多添加一些中途航线,供乘客选择。

.4-5月热门城市所有航班出行中,中途占比高,没有长途旅客,短途较少,只有5.74%

三. 参赛总结

    FineBi使用

首先在使用中,从连接开始FineBi便支持多种数据源的连接,包括数据库、ExcelCSV等,这次我使用本地数据库mysql8.0,可以通过简单的操作将数据导入到FineBi中进行后续分析和可视化提供了直观易用的报告设计界面,在其中选择合适的图表类型、字段、筛选条件等来呈现数据。通过拖放和配置属性,可以快速创建专业水平的报告布局。在构建组件时,我发现FineBi拥有各种图表类型,如柱状图、折线图、饼图、地图等,我们可以根据需求选择合适的图表进行数据展示。同时,FineBi还提供了丰富的图表样式和配置选项,允许我们自定义颜色、字体、标签、轴刻度等,以满足个性化的需求。在此基础上FineBi支持交互式操作,我们可以通过对图表进行缩放、平移、筛选等操作来探索数据的不同维度和层次。这种交互性能够帮助我们更深入地理解数据背后的模式和关联。在创建仪表盘时,我们可以在一个界面上同时展示多个图表和指标。通过对仪表盘进行布局和配置,实现全方位的数据分析和监控。最终还可以将报告导出为图片、PDF等格式,或者通过链接和嵌入代码的方式与他人共享。

    个人总结

在从寻找数据到导入再到制作可视化,并不是一帆风顺,再寻找数据时,因为数据格式,数据值的问题卡了很久时间,通过Datagrip数据库语句操作,加上FineBi中自带的数据操作,将文本数据转化为我们需求的数据,在数据清洗上也进行了很多时间的琢磨,然后连接数据库时又因为数据库驱动不对应进行修改,最终得益于帆软社区的大佬和老师,才得以解决,然后在制作过程中,对数据维度以及可视化方向等等的选择上,都因为目标不明确,可视化目的不清楚遇到困难,再次我要感谢我的团队伙伴陈学森和我的指导老师张键老师,及时的沟通和思路的分析,帮我清晰了此次分析的逻辑,最终才得以做好,这次比赛不仅是对我个人能力的考察,也是对我们团队整体的测量,通过这次比赛,让我知道团队协作的重要性,感谢平台提供的这次机会。

四. 参赛文档

携程机票分析.pdf (3.3 M)

发表于 2023-8-8 19:30:15
恭喜通过大赛初审,获得参与奖和手气红包!
1、可能受编辑器影响,文中图片无法点击放大,建议调整下图片大小提高图片清晰度,方便评委查看!
2、如果使用本地BI制作,且确保作品已完成不再需要修改,建议尽快联系组委会助手苏茜,进行作品资源迁移,导入大赛公共平台,形成在线模板查看链接,方便评委查看。

期待选手完善之后的作品~~
发表于 2023-9-6 22:25:01
打卡:1、分析报告中建议完善相关的结论信息,2、文字显示有点看不清,如矩形树图,文本颜色建议改为黑色
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

发表于 2023-9-7 11:04:31
打卡:作品整体配色有些不太和谐,颜色跳跃没有形成统一的画风。给人一种拼凑的感觉。
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

发表于 2023-9-7 15:44:59
1、可能受编辑器影响,文章的排版看起来不是很舒服,文章提交后是可以优化的,如果优化过就更好了
2、报表的配色不太统一,颜色跳跃度较大,建议调整~
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

发表于 2023-9-13 09:29:50
打卡:个人认为该作品是完整且丰富的、分析思路也清晰,但是仪表板的制作风格及排版等还有很大的优化空间。另外,提两个小建议:1.可视化图表展示4-5月整体的机票数据情况,建议可以增加时间筛选控件,以实现灵活选择数据分析的时间段;2.报告中的文字分析内容可以以文本组件的方式展示在仪表板中。
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

发表于 2023-9-13 11:45:29
打卡:整体配色感觉可以调整一下,分析内容比较丰富,需要花时间吸收。
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

发表于 2023-9-13 19:23:06
打卡:
报告内容丰富,思路也很清晰,在这里提几个小建议:
1、关于旅途类型的划分,按照报告中这样划分,发现没有长途,是不是我们划分的依据并不合理?
2、关于总城市记录图,因为有出发城市很到达城市,是不是可以用桑基图来展现会有更好的视觉效果?
3、对于某些建议:例如南航,国航,厦门航空以及东方航空增加一些中途航线。这样建议的得出是不是还要考虑到客户的实际需求,也就是对中途航线有需求的客户是多少?目前是否已经满足或者是存在缺口,这样给出的建议才会更有说服力。
参与人数 +1 F币 +6 理由
兔子酱 + 6 打卡奖励-最走心评论

查看全部评分

发表于 2023-9-14 10:06:41
打卡:个人建议,选取的时间范围是不是短了点,或者点明是“五一前后机票数据分析”?然后对比一下2019年(疫情前)这个的选题方向?
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

发表于 2023-9-16 18:23:53
打卡:
工具运用的很多,整体的分析思路不错,UI设计的整机很舒服。整体故事化的讲解,逻辑贯穿始终
发表于 2023-9-25 17:33:20
给优秀的同学点个赞,工具掌握的挺多的 ,过程介绍的挺详细的,我也会看携程网。
发表于 2023-10-3 18:39:42
打卡
作品分析指标明确,解读详细,具有完整的数据分析过程体现,图表类型选取合理,能够恰当的表达相关的数据分析场景。
参与人数 +1 F币 +2 理由
兔子酱 + 2 打卡奖励

查看全部评分

发表于 2023-10-13 10:44:59
打卡:不错的数据分析框架,配色统一,布局合理美观,故事化表达相关的数据分析场景,值得学习。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

12回帖数 1关注人数 3395浏览人数
最后回复于:2023-10-13 10:44

返回顶部 返回列表