恭喜本作品荣获“2021帆软BI可视化夏季挑战赛-最佳展现创意奖”
1、点击浏览在线作品
2、点击查看/编辑在线模板(完成问卷即可获取平台账号)
帆软专家点评:
针对油耗影响因素的挖掘过程非常严谨,分析结果对于业务的实用价值也很大,整体上完成度较好。
有几个小建议:第三部分思路拆解是完成可视化展现的分析,建议放到制作过程之后;基于数据的分析思路较少;建议把相关系数换成相关程度展示,可以用表格说明相关系数和相关程度的对应关系,如总结中的内容,会更直观;整体布局上建议把饼图放在同一行或者两侧各一个,右上角的散点图也是一样,可以放到两测;中间的柱形图数据差异太大,建议使用左右值轴区分;左下角的表格显示不出所有月份,建议拉长的。
一、参赛信息
- 队名:厦航小飞象
- 队员:蚁志鸿-运行风险控制部、林家尧-运行风险控制部、叶陈沈-运行风险控制部
- 赛道:运行安全赛道
二、分析主题
1、业务背景:随着航班量的增加和航油价格的上涨,燃油消耗在航空公司的运营成本中所占比例逐年增长,飞机的机型、机龄、业载、航段距离、航段时长、航路平均风对油耗都有着不同程度的影响,虽然距离、时长、业载等因素对油耗也有较大的影响,但同一航线这些因素都是相对固定的,而航路平均风因素可以通过选择逆风较小或顺风较大的航路走向从而节省油耗(同一航线航路平均风标准差最大)。
2、分析目标:挖掘航段距离、时长、业载、航路平均风等因素对油耗的影响;因为航路平均风是相对可控的因素,分析航路平均风与航段耗油相关性排名靠前的航线,结合每个月急流位置的变化规律,分析在不同月份选择不同航路走向的航路平均风和油耗对比,在不同月份选择顺风较大/逆风较小的航路走向以节约燃油。
三、思路拆解
维度扩展和数据挖掘:
在没有限定距离、时长、业载等因素的情况下,航路平均风和油耗没有明显的相关性。
图1 未限定距离和时长情况下航路风与油耗无明显相关
但同一航线距离、时长都是相对固定的,而业载因素是不可控的,航班不会为了节油而减少载量。从分析结果看,同一航线航路平均风标准差明显大于航线距离和时长,所以同一航线航路平均风相对可变。
图 2 同一航线航路平均风/航段时长/航线距离标准差
在限定航线的条件下,航路平均风和油耗就有了明显的负相关。
图3 同一航线航路平均风与油耗相关性
分析不同航线航段耗油与距离、时长、业载、航路平均风的相关系数,以及航段距离、时间、航路平均风、业载与航段油耗达到中度以上相关的航线占比。
图 4 航路平均风和油耗相关系数和分区间航班占比
图 5 航段油耗和航段距离、时长、业载等因素相关系数和相关系数分区间占比
东西走向的航班受纬向风影响较大,而南北走向的航班受经向风影响较大,对航路平均风与航段耗油相关性进行排名,排名靠前的航线说明航路平均风与油耗相关性较大,这些航线可通过调整航路走向使航路平均风较大从而实现节油。
图 6 不同航线航段油耗与航路平均风、航段距离、航段时长、业载相关系数及排名
分析纬向风不同月份的变化,即西风急流随月份的变化,可在逆风飞行避开大顶风,顺风飞行靠近急流达到节油的目的。
图 7 纬向风1~12月变化
根据提供航线不同月份选择不同航路走向的油耗对比和航路平均风对比,可以进一步得出不同航线在不同月份选择哪个走向更为节油。
图 8 不同航路走向各月份航路平均风对比
图 9不同航路走向计划各月份航段耗油对比
四、数据准备
1.赛题数据:使用了航班ID、起降机场四字码和城市、航班日期、航线代号、计划航段油耗、计划航段距离、计划航段时长、计划业载;
2.新增数据:
a.航线机场数据:为了展示航线流向地图,将航班的起飞机场城市、四字码、航班ID等字段做为起飞机场数据集,并添加序号字段值为0,起飞+降落机场生成航线字段,降落机场城市、四字码、起飞机场、航班ID等几个字段做为降落机场数据集,并添加序号字段值为1,起飞+降落机场生成航线字段。将起飞机场和落地机场两个数据集上下合并作为航线机场数据集,并关联起降机场经纬度数据,根据起降机场经度差和纬度差的对比区分东西走向和南北走向航班(经度差>纬度差为东西走向,其它为南北走向)。
b.航路平均风:根据航班ID查询对应航班飞行计划中的航路平均风,原始为字符串格式,M代表负数即顶风,P代表正数即顺风,用IF(MID(WIND,1,1)="M","-"+MID(WIND,2,3),MID(WIND,2,3))将字符转换为数值字段;
c.历史纬向风:
纬向风就是沿纬度方向的风,即东西向风,数据采用NCEP再分析资料1981~2010年各个纬度的月平均风数据。
数据范围为17.5~55°N,75~130°E。
纬向风表结构
数据样例及说明
说明:表中数值表示在对应纬度上该月份75~130°E之间的月平均风,如表中标黑体的单元格表示1月份在纬度55°N上,从75~130°E之间的平均风为12.68米/秒。
注:再分析资料是对观测资料(包括地面观测、卫星、雷达、探空等)进行质量控制,然后再同化入全球模式后,所获得的资料。一定程度上可以近似的认为这就是实际的大气状况。NCEP是美国国家环境预报中心,目前主流的高空历史气象风主要采用NCEP和EC(欧洲中心)两家机构制作的再分析资料。
d.航段距离、航段时长、航路平均风、实际业载与航段油耗的相关系数:
根据皮尔逊相关系数公式
即相关系数等于X和Y两个参数的协方差除以X和Y的标准差的乘积
通过将航段距离、航段时长、航路平均风、业载按航线分组汇总求平均和标准差,进而求分组汇总的协方差,将协方差除以两个参数的标准差的乘积得出不同航线航段耗油与航段距离、航段时长、航路平均风、业载的相关系数。
3.数据质量:
数据集存在航线代号/实际业载/计划业载/实际航段时长等字段为空的情况,对这些脏数据进行字段非空条件过滤。
部分国内航段油耗偏小或偏大,将航段油耗限制在800-30000KG过滤掉不合理的油耗数据。
过滤掉只有不足10个航班,以免相关系数计算存在偏差。
过滤掉本场训练航班(起飞机场落地机场四字码相等)。
选择国内航班,即过滤掉起飞和降落机场四字码不为Z开头的航班。
五、仪表盘制作
1.航线地图:
图表选择:用流向地图展示航线可以大致看出航线结构,同时区分东西走向和南北走向的航班,分走向展示航班的数量。
布局设置:将航线地图放在中上方比较显眼的位置可以直观地看到航线的分布,同时通过航向(东西/南北)字段关联了其它图表的查询。
2.纬向风分布:
图表选择:选择分组表格可以看到每个月各个纬度上的平均风,同时通过数据条可以直观地看到不同纬度平均风的差异以及最大风(急流)所在的纬度。
布局设置:纬向风按月分布可以直观地看到各个月份西风急流的位置,为不同月份航路走向选择提供一个大致的参考,所以放左上角位置。
3.油耗与航路风、距离的散点图以及航段油耗与距离、时长、航路平均风、业载相关系数饼图排序图:
图表选择:散点图可以分析两个要素之间的相关性,而用饼图可以直观地看出航段耗油与距离、时长、航路平均风、业载几个因子达到不同级别相关的航班占比,用文本排序可以查看不同航线航段耗油与距离、时长、航路平均风、业载相关系数的对比,同时用排名显示航路平均风与油耗相关性较好的航线。
布局设置:通过航线地图的关联查询展示东西向和南北向航班油耗与航路平均风的相关系数对比,说明东西向航班大部分航班油耗与航路平均风有明显负相关。
4.不同航线各月份不同航路走向的航段耗油和航路平均风
图表选择:用航线和月份进行分组对比组内选择不同航路走向的油耗和平均风,用柱状图可以直观看到选择不同航路走向的油耗和航路平均风对比。
图 10 航段耗油影响指标分析仪表板
六、分析总结
根据经验,相关系数取值与相关程度关系可按如下分类:
我国大部分地区处于西风带,自东向西飞行的航班多为顶风,选择顶风小的航路走向(远离西风急流)会较省油,而自西向东飞行的航班多为顺风,选择顺风大的航路走向(靠近西风急流)会更节油,从气候角度看,随着副热带高压脊线的季节性变化,西风急流位置会随着季节变化出现南北摆动,导致东西走向的航班有的月份走北线比较节油,有的月份走南线比较节油。从分析结果看东西走向和南北走向的航班在航路平均风与航段耗油相关性上的差异较大,东西走向的达到中度以上负相关的航班占比达到92%以上,而南北走向的航班只有不到80%的航班达到中度相关。其中东西走向的杭州-桂林、虹桥-长沙等航班航路平均风与油耗相关系数小于-0.9,这些负相关高的航班在不同月份选择不同的航路走向可以避开大顶风或靠近大顺风从而节省燃油,优化空间大。
编辑于 2021-7-2 18:58 编辑于 2021-7-2 19:01 编辑于 2021-7-3 09:32
|