请上传宽度大于 1200px,高度大于 164px 的封面图片
    调整图片尺寸与位置
    滚轮可以放大缩小图片尺寸,按住图片拖动可调整位置,多余的会自动被裁剪掉
取消
zhihongyee(uid:242568)
职业资格认证:尚未取得认证
【2022BI数据分析大赛】航路运行风险分析
一、选手简介 1、选手介绍 团队名称:厦航小飞象 成员介绍:蚁志鸿(厦航)、林家尧(厦航)、叶陈沈(厦航)、刘晨璇(厦航)   2、参赛初衷 让更多的同事参与FineBI工具的使用,挖掘业务中数据之间的关联性,通过比赛实践提升数据分析的技巧。 在比赛过程中也获得跟参赛选手交流的机会,从而拓宽数据分析的思路。   二、作品介绍 1、业务背景/需求痛点         随着航空业的迅速发展,航空气象对航空安全的影响逐渐备受关注,对于机场来说,有地面自动站、闪电定位仪等观测手段,在时间和空间上观测密度都比较高,而航路天气,仅靠常规的探空资料远远不足以描述高空的大气状态,所以航路天气预报一直以来都是航空气象预报的难点。对航路影响的主要天气包括颠簸、积冰、雷暴等。严重的颠簸可造成飞机结构性损伤和人员受伤等事件;飞机表面积冰可能造成飞机升力下降,空速管积冰可能导致仪表指示错误造成严重事故。而雷暴可能造成飞机机体烧蚀、通讯设备干扰等影响。         机场的气候特征会随着季节出现一定规律的变化,而航路天气受高空急流、水汽输送条件等气象因素的季节性变化影响,也会呈现一定的气候特征。通过分析颠簸、积冰、雷暴等航路天气的季节性变化特征可以给航路规划提供一定的参考,同时为运行提供航路风险提示,尽可能规避航路天气风险。通过挖掘颠簸指数、积冰指数以及风切变等指标与实际观测数据的关联性,从而为航路预报提供参考,提高预报准确性。         需求痛点:在航路规划、航路风险评估的过程中,航路的颠簸、积冰、雷暴是航空气象预报的重点,由于这一领域的观测和预报技术手段有限,所以航路天气预报一直是航空气象的难点。   2、数据来源          本次参赛使用的基础数据包括三类,一类是观测数据,一类是再分析数据,还有一类是应用再分析资料计算出来的参数。          第一类观测数据采用的是2021年的EDR观测数据,飞机遭遇颠簸的强度除了大气条件之外还可能受机型、飞行员操作等因素影响,而EDR(Eddy Disspation Rate,即涡旋耗散率)是描述大气湍流强度的指标,可以排除非气象因素导致的颠簸,能较为客观地评估航路颠簸的强度。目前EDR已被ICAO(国际民用航空组织)作为衡量颠簸强度的标准。从历史经验看,对于中小型飞机,EDR值达到0.2以上可出现中度以上颠簸,考虑数据的敏感性,对观测数据进行脱敏处理,仅保留观测时间、高度、EDR强度等字段。          第二类为再分析资料,是对观测资料(包括地面观测、卫星,还有雷达、探空、浮标、飞机、船舶等等)进行质量控制,再同化入全球模式后,所获得的资料。一定程度上可以近似的认为这就是实际的大气状况。分析中使用了再分析资料的风、温、湿度来计算颠簸及积冰指数,同时将再分析资料中的对流降水数据作为雷暴的落区分布统计,从而分析各个月份雷暴的大致落区和年月时序分布。          第三类是利用再分析资料通过一系列算法计算出来的指标,包括ICAO(国际民用航空组织)推荐使用的颠簸预报算法Ellrod TI1指数、风切变指数以及ICAO使用的积冰指数。   3、分析思路         在航路规划和航路风险的识别过程中,最重要的就是从空间和时间两个维度对航路颠簸、积冰和雷暴分布特征进行分析。寻找航路天气的气候特征,从而规避航路气象风险。         通过对影响颠簸的Ellord指数、垂直风切变等参数的时空分布特征与实际颠簸观测的落区分布特征分析颠簸的季节性分布规律。         利用积冰指数分析积冰的在不同月份的分布特征,从而分析积冰强度的分布特征。         由于雷暴与对流性降水有较好的相关性,利用历史再分析资料中的对流降水可以分析航路雷雨落区的分布特征。   4、数据处理         EDR观测数据是由飞机探测得到的,只有在飞机飞过的地方才有EDR的探测数据,由于每个航司在不同航线上的航班量差异较大,会导致航班量大的航线上观测数据多,观测到达到中度以上颠簸的点也会比航线覆盖的区域明显偏大。为了缩小不同航线上数据量级的差异,需要对数据进行归一化处理。分析采用了对数归一化处理,即以10为底的对数转换函数,对应的归一化方法为: x' = log10(x) /log10(max) 另外,EDR观测本身有质量控制,置信度在0~1之间,0为不可信数据,1为可靠数据,通过过滤置信度小于0.8的数据对观测数据进行质量控制。   5、可视化报告 (1)颠簸水平分布地图         根据统计,对于主流的波音737、空客A320等中等大小机型,EDR达到0.2以上的情况下可出现中等强度的颠簸,为了分析中等强度以上颠簸,对2021年的EDR观测数据进行过滤,只展示EDR达到0.2以上的数据。   AC weight class Estimated EDR Threshold * 100 Light Moderate Severe Extreme Light 13 16 36 64 Medium (Large) 15 20 44 79 Heavy 17 24 54 96          采用热力地图方式展示EDR观测数据的大致落区分布。可以看到大部分中度以上颠簸出现在机场附近区域,主要是由于飞机在起飞和下降阶段在穿越大气各个高度层的过程中风速变化较大,风切变较明显,导致起降阶段遭遇的颠簸会相对较多。另外由于数据选取的是厦航的EDR观测数据,所以在主基地厦门附近区域颠簸观测数据量较多,在热力图中可以看到厦门附近区域中度以上EDR观测值较多。              为了消除因航班量导致观测数据分布的不均,对数据进行均一化处理,均一化处理完的EDR分布可以看出中度以上颠簸主要分布在几个区域,一个是西北东部到华北,主要是由于这一区域冷空气活动频繁,尤其是冬春季,呼和浩特、北京都是冬春季大风、风切变出现频次较多的机场,容易出现较强颠簸。另外,可以关注到在西宁、兰州、大连等机场附近也是颠簸出现的热点,这几个机场由于附近地形复杂,容易因乱流产生颠簸。而长江口、珠江口、台湾海峡附近这些沿海机场附近在冷空气南下的情况下近地层风速也经常比内陆机场大,导致这些地区容易出现颠簸。此外昆明机场本身是高原机场,且受季风影响,也容易因西南急流出现较大的风速,导致机场附近区域颠簸出现频次也较多。   (2)颠簸高度分布           对中度以上颠簸出现的高度层进行聚类分析。可以看到中度以上颠簸主要出现在0~9000英尺高度,主要是因为中低层风向风速差异较大,飞机在进近过程中穿越各个高度层过程中容易因风向风速的切变导致颠簸。 (3)颠簸时间分布         EDR达到0.2以上的观测数据按月份进行聚类分析,可以看到5月份出现中等强度以上颠簸频次最多,其次是3~4月和6~7月,主要是这几个月份强对流天气出现频率较高,雷暴、下击暴流等强对流天气容易在机场附近区域产生乱流,导致颠簸出现概率较高。              从日变化看,白天随着气温升高,湍流增强,导致出现颠簸的概率增大,尤其是夏季午后对流天气增多,导致午后飞机遭遇中等强度以上颠簸的频次也明显增多。     (4)颠簸指数分布           由于EDR观测数据是由飞机探测的数据计算得到的,所以只有在飞机飞行的轨迹上才有观测数据,为了弥补EDR观测数据在时空上的不足,利用再分析资料月平均风数据,通过WAFS推荐使用的Ellord TI指数算法计算得到不同月份颠簸指数达到3以上(中等以上颠簸)的分布。可以看到不同月份颠簸指数随西风急流的位置摆动会有明显的变化。如下面图中1、2月份TI指数达到3以上的分布就有明显差异:   (5)垂直风切变指数 通常情况下,垂直风切变指数越大,遇到颠簸的可能性越大。 同样,垂直风切变指数由于急流的季节性摆动,分布也会出现明显差异。ICAO推荐的风切变强度判断标准: 轻度 每30米(100英尺)的高度风速变化0-4海里/小时(含) 中度 每30米(100英尺)的高度风速变化5-8海里/小时(含) 强烈 每30米(100英尺)的高度风速变化9-12海里/小时(含) 严重 每30米(100英尺)的高度风速变化超过12海里/小时   (6)积冰指数分布          积冰也是采用再分析资料的月平均湿度和温度数据,通过ICAO推荐的积冰指数算法计算得到,通过热力图方式进行展示,可以看到积冰区主要分布在我国西南地区,主要是受西南暖湿气流影响,西南地区水汽充足温湿条件较有利于产生积冰:   (7)雷暴落区分布         雷暴也是对航班运行影响较大的航路天气,对于航路雷雨的分布考虑对流降水与雷雨落区较吻合,统计中我们采用了2021年的再分析资料中对流降水落区分布作为雷暴落区的分布: (8)最终结果呈现的页面布局   三、参赛总结 1、FineBI工具          FineBI的优势在于操作简单,数据处理便捷,上手快,视觉效果好,能够直观地描述数据背后的关联逻辑。   2、参赛总结          航路颠簸、积冰以及雷暴对航空安全均可能构成较大的危害,也是航空气象预报的重点和难点,通过历史资料分析可以挖掘颠簸、积冰、雷暴等天气的季节变化规律,从而为航路规划提供参考,为航班运行提前做出风险提示,从而尽可能规避航路天气产生的运行风险。从历史数据分析看颠簸主要出现在夏季,尤其5月份居多,多出现于9000英尺以下,落区多在西北及东南沿海这些容易出现风切变的机场附近区域,从高空航路看,颠簸指数较高的地方大致与急流位置相对应,也是风切变较大的区域。而积冰区主要出现在西南一带暖湿气流比较强的地方。雷暴落区则集中在江南、华南一带。
【2021夏季挑战赛】航段油耗影响指标分析
恭喜本作品荣获“2021帆软BI可视化夏季挑战赛-最佳展现创意奖” 1、点击浏览在线作品 2、点击查看/编辑在线模板(完成问卷即可获取平台账号)   帆软专家点评: 针对油耗影响因素的挖掘过程非常严谨,分析结果对于业务的实用价值也很大,整体上完成度较好。 有几个小建议:第三部分思路拆解是完成可视化展现的分析,建议放到制作过程之后;基于数据的分析思路较少;建议把相关系数换成相关程度展示,可以用表格说明相关系数和相关程度的对应关系,如总结中的内容,会更直观;整体布局上建议把饼图放在同一行或者两侧各一个,右上角的散点图也是一样,可以放到两测;中间的柱形图数据差异太大,建议使用左右值轴区分;左下角的表格显示不出所有月份,建议拉长的。     一、参赛信息 队名:厦航小飞象 队员:蚁志鸿-运行风险控制部、林家尧-运行风险控制部、叶陈沈-运行风险控制部 赛道:运行安全赛道 二、分析主题 1、业务背景:随着航班量的增加和航油价格的上涨,燃油消耗在航空公司的运营成本中所占比例逐年增长,飞机的机型、机龄、业载、航段距离、航段时长、航路平均风对油耗都有着不同程度的影响,虽然距离、时长、业载等因素对油耗也有较大的影响,但同一航线这些因素都是相对固定的,而航路平均风因素可以通过选择逆风较小或顺风较大的航路走向从而节省油耗(同一航线航路平均风标准差最大)。 2、分析目标:挖掘航段距离、时长、业载、航路平均风等因素对油耗的影响;因为航路平均风是相对可控的因素,分析航路平均风与航段耗油相关性排名靠前的航线,结合每个月急流位置的变化规律,分析在不同月份选择不同航路走向的航路平均风和油耗对比,在不同月份选择顺风较大/逆风较小的航路走向以节约燃油。 三、思路拆解 维度扩展和数据挖掘: 在没有限定距离、时长、业载等因素的情况下,航路平均风和油耗没有明显的相关性。 146548 图1 未限定距离和时长情况下航路风与油耗无明显相关   但同一航线距离、时长都是相对固定的,而业载因素是不可控的,航班不会为了节油而减少载量。从分析结果看,同一航线航路平均风标准差明显大于航线距离和时长,所以同一航线航路平均风相对可变。 146549 图 2  同一航线航路平均风/航段时长/航线距离标准差 在限定航线的条件下,航路平均风和油耗就有了明显的负相关。 146550 图3 同一航线航路平均风与油耗相关性   分析不同航线航段耗油与距离、时长、业载、航路平均风的相关系数,以及航段距离、时间、航路平均风、业载与航段油耗达到中度以上相关的航线占比。     146551 图 4 航路平均风和油耗相关系数和分区间航班占比 146552 图 5 航段油耗和航段距离、时长、业载等因素相关系数和相关系数分区间占比   东西走向的航班受纬向风影响较大,而南北走向的航班受经向风影响较大,对航路平均风与航段耗油相关性进行排名,排名靠前的航线说明航路平均风与油耗相关性较大,这些航线可通过调整航路走向使航路平均风较大从而实现节油。 146553 图 6 不同航线航段油耗与航路平均风、航段距离、航段时长、业载相关系数及排名   分析纬向风不同月份的变化,即西风急流随月份的变化,可在逆风飞行避开大顶风,顺风飞行靠近急流达到节油的目的。   146554 图 7 纬向风1~12月变化 根据提供航线不同月份选择不同航路走向的油耗对比和航路平均风对比,可以进一步得出不同航线在不同月份选择哪个走向更为节油。 146546 图 8 不同航路走向各月份航路平均风对比 146547 图 9不同航路走向计划各月份航段耗油对比 四、数据准备 1.赛题数据:使用了航班ID、起降机场四字码和城市、航班日期、航线代号、计划航段油耗、计划航段距离、计划航段时长、计划业载;   2.新增数据: a.航线机场数据:为了展示航线流向地图,将航班的起飞机场城市、四字码、航班ID等字段做为起飞机场数据集,并添加序号字段值为0,起飞+降落机场生成航线字段,降落机场城市、四字码、起飞机场、航班ID等几个字段做为降落机场数据集,并添加序号字段值为1,起飞+降落机场生成航线字段。将起飞机场和落地机场两个数据集上下合并作为航线机场数据集,并关联起降机场经纬度数据,根据起降机场经度差和纬度差的对比区分东西走向和南北走向航班(经度差>纬度差为东西走向,其它为南北走向)。 b.航路平均风:根据航班ID查询对应航班飞行计划中的航路平均风,原始为字符串格式,M代表负数即顶风,P代表正数即顺风,用IF(MID(WIND,1,1)="M","-"+MID(WIND,2,3),MID(WIND,2,3))将字符转换为数值字段; c.历史纬向风: 纬向风就是沿纬度方向的风,即东西向风,数据采用NCEP再分析资料1981~2010年各个纬度的月平均风数据。 数据范围为17.5~55°N,75~130°E。 纬向风表结构 字段名称 字段类型 说明 纬度 数值 纬度,间隔2.5°一个数值 1 数值 1月纬向平均风 2 数值 2月纬向平均风 ... 数值 ... 数据样例及说明 纬度   月份 1 2 3 4 5 55 12.68 13.57 12.96 16.24 13.84 52.5 13.23 14.51 13.94 16.64 13.93 50 14.74 16.19 16.25 17.89 14.99 ... ... ... ... ... ... 说明:表中数值表示在对应纬度上该月份75~130°E之间的月平均风,如表中标黑体的单元格表示1月份在纬度55°N上,从75~130°E之间的平均风为12.68米/秒。 注:再分析资料是对观测资料(包括地面观测、卫星、雷达、探空等)进行质量控制,然后再同化入全球模式后,所获得的资料。一定程度上可以近似的认为这就是实际的大气状况。NCEP是美国国家环境预报中心,目前主流的高空历史气象风主要采用NCEP和EC(欧洲中心)两家机构制作的再分析资料。 d.航段距离、航段时长、航路平均风、实际业载与航段油耗的相关系数: 根据皮尔逊相关系数公式 145992 即相关系数等于X和Y两个参数的协方差除以X和Y的标准差的乘积 通过将航段距离、航段时长、航路平均风、业载按航线分组汇总求平均和标准差,进而求分组汇总的协方差,将协方差除以两个参数的标准差的乘积得出不同航线航段耗油与航段距离、航段时长、航路平均风、业载的相关系数。   3.数据质量: 数据集存在航线代号/实际业载/计划业载/实际航段时长等字段为空的情况,对这些脏数据进行字段非空条件过滤。 部分国内航段油耗偏小或偏大,将航段油耗限制在800-30000KG过滤掉不合理的油耗数据。 过滤掉只有不足10个航班,以免相关系数计算存在偏差。 过滤掉本场训练航班(起飞机场落地机场四字码相等)。 选择国内航班,即过滤掉起飞和降落机场四字码不为Z开头的航班。 五、仪表盘制作 1.航线地图: 图表选择:用流向地图展示航线可以大致看出航线结构,同时区分东西走向和南北走向的航班,分走向展示航班的数量。 布局设置:将航线地图放在中上方比较显眼的位置可以直观地看到航线的分布,同时通过航向(东西/南北)字段关联了其它图表的查询。 2.纬向风分布: 图表选择:选择分组表格可以看到每个月各个纬度上的平均风,同时通过数据条可以直观地看到不同纬度平均风的差异以及最大风(急流)所在的纬度。 布局设置:纬向风按月分布可以直观地看到各个月份西风急流的位置,为不同月份航路走向选择提供一个大致的参考,所以放左上角位置。 3.油耗与航路风、距离的散点图以及航段油耗与距离、时长、航路平均风、业载相关系数饼图排序图: 图表选择:散点图可以分析两个要素之间的相关性,而用饼图可以直观地看出航段耗油与距离、时长、航路平均风、业载几个因子达到不同级别相关的航班占比,用文本排序可以查看不同航线航段耗油与距离、时长、航路平均风、业载相关系数的对比,同时用排名显示航路平均风与油耗相关性较好的航线。 布局设置:通过航线地图的关联查询展示东西向和南北向航班油耗与航路平均风的相关系数对比,说明东西向航班大部分航班油耗与航路平均风有明显负相关。 4.不同航线各月份不同航路走向的航段耗油和航路平均风 图表选择:用航线和月份进行分组对比组内选择不同航路走向的油耗和平均风,用柱状图可以直观看到选择不同航路走向的油耗和航路平均风对比。 146555 图 10 航段耗油影响指标分析仪表板 六、分析总结 根据经验,相关系数取值与相关程度关系可按如下分类: 相关系数 相关程度 0.00~0.19 极低度相关 0.20~0.39 低度相关 0.40~0.69 中度相关 0.70~0.89 高度相关 0.90~1.00 极高相关   我国大部分地区处于西风带,自东向西飞行的航班多为顶风,选择顶风小的航路走向(远离西风急流)会较省油,而自西向东飞行的航班多为顺风,选择顺风大的航路走向(靠近西风急流)会更节油,从气候角度看,随着副热带高压脊线的季节性变化,西风急流位置会随着季节变化出现南北摆动,导致东西走向的航班有的月份走北线比较节油,有的月份走南线比较节油。从分析结果看东西走向和南北走向的航班在航路平均风与航段耗油相关性上的差异较大,东西走向的达到中度以上负相关的航班占比达到92%以上,而南北走向的航班只有不到80%的航班达到中度相关。其中东西走向的杭州-桂林、虹桥-长沙等航班航路平均风与油耗相关系数小于-0.9,这些负相关高的航班在不同月份选择不同的航路走向可以避开大顶风或靠近大顺风从而节省燃油,优化空间大。 编辑于 2021-7-2 18:58   编辑于 2021-7-2 19:01   编辑于 2021-7-3 09:32  
个人成就
内容被浏览31,052
加入社区5年208天
返回顶部