一、选手简介
1、选手介绍
- 团队名称:厦航小飞象
- 成员介绍:蚁志鸿(厦航)、林家尧(厦航)、叶陈沈(厦航)、刘晨璇(厦航)
2、参赛初衷
- 让更多的同事参与FineBI工具的使用,挖掘业务中数据之间的关联性,通过比赛实践提升数据分析的技巧。
- 在比赛过程中也获得跟参赛选手交流的机会,从而拓宽数据分析的思路。
二、作品介绍
1、业务背景/需求痛点
随着航空业的迅速发展,航空气象对航空安全的影响逐渐备受关注,对于机场来说,有地面自动站、闪电定位仪等观测手段,在时间和空间上观测密度都比较高,而航路天气,仅靠常规的探空资料远远不足以描述高空的大气状态,所以航路天气预报一直以来都是航空气象预报的难点。对航路影响的主要天气包括颠簸、积冰、雷暴等。严重的颠簸可造成飞机结构性损伤和人员受伤等事件;飞机表面积冰可能造成飞机升力下降,空速管积冰可能导致仪表指示错误造成严重事故。而雷暴可能造成飞机机体烧蚀、通讯设备干扰等影响。
机场的气候特征会随着季节出现一定规律的变化,而航路天气受高空急流、水汽输送条件等气象因素的季节性变化影响,也会呈现一定的气候特征。通过分析颠簸、积冰、雷暴等航路天气的季节性变化特征可以给航路规划提供一定的参考,同时为运行提供航路风险提示,尽可能规避航路天气风险。通过挖掘颠簸指数、积冰指数以及风切变等指标与实际观测数据的关联性,从而为航路预报提供参考,提高预报准确性。
需求痛点:在航路规划、航路风险评估的过程中,航路的颠簸、积冰、雷暴是航空气象预报的重点,由于这一领域的观测和预报技术手段有限,所以航路天气预报一直是航空气象的难点。
2、数据来源
本次参赛使用的基础数据包括三类,一类是观测数据,一类是再分析数据,还有一类是应用再分析资料计算出来的参数。
第一类观测数据采用的是2021年的EDR观测数据,飞机遭遇颠簸的强度除了大气条件之外还可能受机型、飞行员操作等因素影响,而EDR(Eddy Disspation Rate,即涡旋耗散率)是描述大气湍流强度的指标,可以排除非气象因素导致的颠簸,能较为客观地评估航路颠簸的强度。目前EDR已被ICAO(国际民用航空组织)作为衡量颠簸强度的标准。从历史经验看,对于中小型飞机,EDR值达到0.2以上可出现中度以上颠簸,考虑数据的敏感性,对观测数据进行脱敏处理,仅保留观测时间、高度、EDR强度等字段。
第二类为再分析资料,是对观测资料(包括地面观测、卫星,还有雷达、探空、浮标、飞机、船舶等等)进行质量控制,再同化入全球模式后,所获得的资料。一定程度上可以近似的认为这就是实际的大气状况。分析中使用了再分析资料的风、温、湿度来计算颠簸及积冰指数,同时将再分析资料中的对流降水数据作为雷暴的落区分布统计,从而分析各个月份雷暴的大致落区和年月时序分布。
第三类是利用再分析资料通过一系列算法计算出来的指标,包括ICAO(国际民用航空组织)推荐使用的颠簸预报算法Ellrod TI1指数、风切变指数以及ICAO使用的积冰指数。
3、分析思路
在航路规划和航路风险的识别过程中,最重要的就是从空间和时间两个维度对航路颠簸、积冰和雷暴分布特征进行分析。寻找航路天气的气候特征,从而规避航路气象风险。
通过对影响颠簸的Ellord指数、垂直风切变等参数的时空分布特征与实际颠簸观测的落区分布特征分析颠簸的季节性分布规律。
利用积冰指数分析积冰的在不同月份的分布特征,从而分析积冰强度的分布特征。
由于雷暴与对流性降水有较好的相关性,利用历史再分析资料中的对流降水可以分析航路雷雨落区的分布特征。
4、数据处理
EDR观测数据是由飞机探测得到的,只有在飞机飞过的地方才有EDR的探测数据,由于每个航司在不同航线上的航班量差异较大,会导致航班量大的航线上观测数据多,观测到达到中度以上颠簸的点也会比航线覆盖的区域明显偏大。为了缩小不同航线上数据量级的差异,需要对数据进行归一化处理。分析采用了对数归一化处理,即以10为底的对数转换函数,对应的归一化方法为:
x' = log10(x) /log10(max)
另外,EDR观测本身有质量控制,置信度在0~1之间,0为不可信数据,1为可靠数据,通过过滤置信度小于0.8的数据对观测数据进行质量控制。
5、可视化报告
(1)颠簸水平分布地图
根据统计,对于主流的波音737、空客A320等中等大小机型,EDR达到0.2以上的情况下可出现中等强度的颠簸,为了分析中等强度以上颠簸,对2021年的EDR观测数据进行过滤,只展示EDR达到0.2以上的数据。
AC weight class
|
Estimated EDR Threshold * 100
|
Light
|
Moderate
|
Severe
|
Extreme
|
Light
|
13
|
16
|
36
|
64
|
Medium (Large)
|
15
|
20
|
44
|
79
|
Heavy
|
17
|
24
|
54
|
96
|
采用热力地图方式展示EDR观测数据的大致落区分布。可以看到大部分中度以上颠簸出现在机场附近区域,主要是由于飞机在起飞和下降阶段在穿越大气各个高度层的过程中风速变化较大,风切变较明显,导致起降阶段遭遇的颠簸会相对较多。另外由于数据选取的是厦航的EDR观测数据,所以在主基地厦门附近区域颠簸观测数据量较多,在热力图中可以看到厦门附近区域中度以上EDR观测值较多。
为了消除因航班量导致观测数据分布的不均,对数据进行均一化处理,均一化处理完的EDR分布可以看出中度以上颠簸主要分布在几个区域,一个是西北东部到华北,主要是由于这一区域冷空气活动频繁,尤其是冬春季,呼和浩特、北京都是冬春季大风、风切变出现频次较多的机场,容易出现较强颠簸。另外,可以关注到在西宁、兰州、大连等机场附近也是颠簸出现的热点,这几个机场由于附近地形复杂,容易因乱流产生颠簸。而长江口、珠江口、台湾海峡附近这些沿海机场附近在冷空气南下的情况下近地层风速也经常比内陆机场大,导致这些地区容易出现颠簸。此外昆明机场本身是高原机场,且受季风影响,也容易因西南急流出现较大的风速,导致机场附近区域颠簸出现频次也较多。
(2)颠簸高度分布
对中度以上颠簸出现的高度层进行聚类分析。可以看到中度以上颠簸主要出现在0~9000英尺高度,主要是因为中低层风向风速差异较大,飞机在进近过程中穿越各个高度层过程中容易因风向风速的切变导致颠簸。
(3)颠簸时间分布
EDR达到0.2以上的观测数据按月份进行聚类分析,可以看到5月份出现中等强度以上颠簸频次最多,其次是3~4月和6~7月,主要是这几个月份强对流天气出现频率较高,雷暴、下击暴流等强对流天气容易在机场附近区域产生乱流,导致颠簸出现概率较高。
从日变化看,白天随着气温升高,湍流增强,导致出现颠簸的概率增大,尤其是夏季午后对流天气增多,导致午后飞机遭遇中等强度以上颠簸的频次也明显增多。
(4)颠簸指数分布
由于EDR观测数据是由飞机探测的数据计算得到的,所以只有在飞机飞行的轨迹上才有观测数据,为了弥补EDR观测数据在时空上的不足,利用再分析资料月平均风数据,通过WAFS推荐使用的Ellord TI指数算法计算得到不同月份颠簸指数达到3以上(中等以上颠簸)的分布。可以看到不同月份颠簸指数随西风急流的位置摆动会有明显的变化。如下面图中1、2月份TI指数达到3以上的分布就有明显差异:
(5)垂直风切变指数
通常情况下,垂直风切变指数越大,遇到颠簸的可能性越大。
同样,垂直风切变指数由于急流的季节性摆动,分布也会出现明显差异。ICAO推荐的风切变强度判断标准:
轻度 每30米(100英尺)的高度风速变化0-4海里/小时(含)
中度 每30米(100英尺)的高度风速变化5-8海里/小时(含)
强烈 每30米(100英尺)的高度风速变化9-12海里/小时(含)
严重 每30米(100英尺)的高度风速变化超过12海里/小时
(6)积冰指数分布
积冰也是采用再分析资料的月平均湿度和温度数据,通过ICAO推荐的积冰指数算法计算得到,通过热力图方式进行展示,可以看到积冰区主要分布在我国西南地区,主要是受西南暖湿气流影响,西南地区水汽充足温湿条件较有利于产生积冰:
(7)雷暴落区分布
雷暴也是对航班运行影响较大的航路天气,对于航路雷雨的分布考虑对流降水与雷雨落区较吻合,统计中我们采用了2021年的再分析资料中对流降水落区分布作为雷暴落区的分布:
(8)最终结果呈现的页面布局
三、参赛总结
1、FineBI工具
FineBI的优势在于操作简单,数据处理便捷,上手快,视觉效果好,能够直观地描述数据背后的关联逻辑。
2、参赛总结
航路颠簸、积冰以及雷暴对航空安全均可能构成较大的危害,也是航空气象预报的重点和难点,通过历史资料分析可以挖掘颠簸、积冰、雷暴等天气的季节变化规律,从而为航路规划提供参考,为航班运行提前做出风险提示,从而尽可能规避航路天气产生的运行风险。从历史数据分析看颠簸主要出现在夏季,尤其5月份居多,多出现于9000英尺以下,落区多在西北及东南沿海这些容易出现风切变的机场附近区域,从高空航路看,颠簸指数较高的地方大致与急流位置相对应,也是风切变较大的区域。而积冰区主要出现在西南一带暖湿气流比较强的地方。雷暴落区则集中在江南、华南一带。
|