关键字:航空公司、指标体系、风险预警
从上世纪末开始,国际民航组织在全球范围内为推行安全管理系统(SMS),通过系统的、积极主动地管理方式,实施风险管理,把安全管理的重点转移到预防事故上,围绕安全政策、风险管理、安全保证和安全促进四个核心推进航空公司的SMS体系建设。中国民用航空局2015年发布了《航空承运人运行控制风险管控系统实施指南》的咨询通告,从管理政策、建设流程、风险等级划分、审批等方面对航空公司运控控制风险管控系统的建设与实施提出了具体要求。而如何将生产运行过程中积累的大量数据和经验统一成量化标准并形成指标化、系统化并应用于风险预警将成航空公司运行安全控领域的发展趋势。
本文将从影响航班运行的各个方面(机组、飞机、环境等)出发进行风险指标因子的梳理,结合贝叶斯理论方法建立数学模型,并推演航班的风险预警趋势,为运行控制人员提供辅助决策。
一、指标体系的搭建
本文以某新开航线为例,对其从人、机、环三方面开展风险指标项的梳理。
1、飞行机组:主要包含机组、机组经验和机组压力展开拆分。机组能力包括飞行机组的资质、其英文程度、培训经历、还包括机组间的搭配风险、熟悉程度和技术级别组合等。
2、航空器:包括飞机状态和飞机保留故障
3、环境:主要包运行相关的起飞机场、着陆机场、起飞备降场、航路备降场和目的地备降场的航行通告、气象标准等重要指标因子。
二、计算模型
风险预警系统是一项非常复杂的系统项目,设计因素众多,可以运用的方法也很多。本文对于经系统的构架进行探讨,而实现方式还需要作进一步研究。通常传统的趋势预警方法可以采用类似交通管制信号的灯号显示法或者运筹学的灵敏度分析等方法,但航空公司拥有数据量超大、复杂性极高、关联性极强的特点,仅采用简单的运筹学方法无法对复杂的、潜在的风险特征因素之间的关系进行较为准确的评估分析。因此,本文尝试采用朴素贝叶斯法则评估各风险因素之间的关联度,从而分析评估所影响航班的风险趋势。
贝叶斯定理
贝叶斯法则是指当分析样本达到接近总数的时候,样本中事件发生的概率将接近总体中事件发生的概率。虽然通常人们在决策过程中往往并不遵循贝叶斯法则,总是根据最近发生的时间和经验给与更多的权值,在面对复杂问题是,希望走捷径,依旧可能性而非根据概率来决定,这种对经典模型的系统性偏离为偏差。但在做系统分析时还需坚持贝叶斯法则。
贝叶斯法则定律是:事件A在事件B发生的条件下的概率,与事件B在事件A的条件下的概率是不一样的,然而,这两种是有确定的关系的,贝叶斯法则就是这种关系的陈述。贝叶斯公式:定义:定义:设A、B是两个事件,且P(A)>0,称P(B|A)=P(AB)/P(A)
贝叶斯公式:
2、朴素贝叶斯
朴素贝叶斯基本假设:条件独立性。
就是说给定类标号A,朴素贝叶斯分类器在估计类条件概率时假设属性之间条件独立。条件独立假设可以形式化的表达如下:
P(B|A)=P(b1|A)*P(b2|A)*…*P(bn|A)
其中每个训练样本可用一个属性向量B=(b1,b2,b3,…,bn)表示,各个属性之间条件独立。
比如,对于一条定义,“拉萨机场为高原机场,高原机场使用A321机型运行时,当温度高于30度,需考虑减载或推迟起飞时间。”可以用一个文本特征向量来表示,x=(拉萨机场,高原机场,A321,温度高于30度,减载,推迟起飞时间)。一般各个词语之间肯定不是相互独立的,有一定的上下文联系。但在朴素贝叶斯文本分类时,我们假设个单词之间没有联系,可以用一个文本特征向量来表示这篇文章,这就是“朴素”的来历。有了条件独立假设,就不必计算X和Y的每一种组合的类条件概率,只需对给定的Y,计算每个xi的条件概率。后一种方法更实用,因为它不需要很大的训练集就能获得较好的概率估计。
每个实例x可由属性值联合描述,而目标函数f(x)从某有限集Y中取值。贝叶斯方法的分类目标是在给定描述实例的属性值<x1,...,xn>下,得到最可能的目标值ymap
基于训练数据估计式中的两个数据项的值:估计P(yj)很容易:计算每个目标值yj出现在训练数据中的频率;估计P(x1,...xn|yj)遇到数据稀疏问题,这个是要有一个非常大的训练数据集,否则无法获得可靠的估计。朴素贝叶斯分类器引入一个简单的假设避免数据稀疏问题:在给定目标值时,属性值之间相互条件独立,即
还举上述例子来说,公司计划使用A321机型飞机运行某高原机场,按照指标体系树形图给出所有可获知的特征项量,例如天气现象x1和温度x2、风x3、机型x4为特征项量,根据分类器规则给出相应匹配的y值进行机器学习。
表1某高原机场计划使用A321机型飞机运行能否放行的数据统计—训练数据
如果这里出现了一个新的属性值x=雷雨,在训练样本中所没有的。当有一个属性的类条件概率为0,则整个类的后验概率就等于0,我们可以直接得到后验概率P(Yes|x1)=P(No|x1)=0,这时二者相等,无法分类。简单的使用样本比例来估计类条件概率的方法太脆弱了,尤其是当训练样本少而属性数目又很大时。解决方法我们将尝试引入m估计(m-estimate)方法来估计条件概率:P(xi|yj)=(nc+mp)/(n+m),其中n是类yj中的样本总数,nc是类yj中取值xi的样本数,m是称为等价样本大小的参数,而p是用户指定的参数。如果没有训练集(即n=0),则P(xi|yj)=p,因此p可以看作是在类yj的样本中观察属性值xi的先验概率。等价样本大小决定先验概率和观测概率nc/n之间的平衡,提高了估计的稳健性。后期我们将就属性关联性较大的分类使用决策树模型进行进一步研究。
三、结论
对于航班的趋势预警,以航空公司运行的各个机场历史运行数据、特征向量数据为基础,需要进行大量数据累计,通过数学模型理论对风险数据进行分析从而计算出各关键要素之间的关联关系和趋势分析,便于逐步替代现有指标体系中采用的头脑风暴的风险打分方法,更为准确的进行风险评估技术,从而实现对特定航班的风险预警,为航班运行风险管控提供辅助决策的支持。