(江南机电设计研究所 贵阳 550009)
摘要:在综合保障研究中,常使用参数统计技术,而此类统计技术需满足其使用前提、假设,否则会造成较大的模型偏差,在航天产品综合保障研究中,由于航天产品往往具有高可靠性、长寿命、结构复杂等特点,因此产品数据呈现离散程度高、数据种类多、小子样等特点,诸多情形无法满足参数统计技术的使用,因此提出在航天产品综合保障研究中根据实际情形选择非参数统计技术,从而便于进行有效的综合保障工作。
关键词:非参数统计、综合保障、航天产品
0.引言
统计技术是通过运用数理统计的方法,有效地收集、整理和分析受到随机因素影响的数据,并针对所涉及的对象作出推断或预测,以便为实施科学的决策提供依据。在航天产品的设计、生产、使用过程中,因设计中存在公差、生产水平产生误差、使用时人员操作因人而异等原因,航天产品状态往往会出现变异,甚至是在明显的稳定条件下,也可观察到变异。这种变异可通过产品和过程的可测量特性观察到,也可在产品的全寿命周期的不同阶段中看到。统计技术有助于对这种变异进行测量、描述、分析、解释和建立模型,甚至在数据相对有限的情况下也可实现。这种数据的统计分析能对更好地理解变异的性质、程度和原因提供帮助,从而有助于解决,甚至防止由变异引起的问题,并促进持续改进[1]。而综合保障研究涉及产品全寿命周期的各项性能研究,且保障性与其余产品五性息息相关,此类研究着重于产品变异的分析,因此在航天产品综合保障研究中应用统计技术有助于了解变异,从而可帮助提高有效性和效率。
1. 参数与非参数统计技术
从样本数据总体分布是否可知的角度,统计技术可分为参数统计技术与非参数统计技术。
参数统计技术即为总体分布形式或分布族给定,通过分布/族的特点,针对分布参数进行统计推断,从而研究产品数据的分布特点,以获得产品性能相关信息,进行综合保障工作。参数统计技术由于是在总体分布/族给定的情形下进行的数据统计推断,因此所得结论往往更准确,更符合预期,但当产品数据事实上不符合设定的总体分布/族时,参数统计技术所得结论往往与真实情况间有较大的偏差,甚至完全背离。而在不进行总体分布/族假定的情况下,进行统计推断的技术称为非参数统计技术。
非参数统计技术又称分布自由统计技术,不涉及总体参数或不依赖于对总体分布的严格假定的推断方法称为非参数方法[3]。非参数统计常用于以下4种情形[4]:第1种情形是待分析资料不满足参数检验所要求的假定,强行使用某种分布进行参数统计推断,往往会导致模型出现较大的偏差,在航天产品综合保障研究中,结构复杂的特点导致产品数据常出现此种情形,除粗略观察数据结构外,通过参数统计技术无法提取更多信息,而非参数统计方法能够通过数据的秩等特征提取其中的隐含信息。第2种情形是资料仅由一些等级构成,如在航天产品综合保障研究中,高可靠性、长寿命的产品特征,使得产品在短期内无法观测到有效连续数据,通常收集到的数据是例如产品状态优、良好、合格等示性特征,因此无法使用参数统计技术。第3种情形是所提的问题中并不包含总体参数,这时也适宜采用非参数方法。第4种情形是当急需要迅速得出结果时采用的简易方法,非参数统计的基本思想是:在总体分布未知的情况下,根据与原来总体分布无关的秩及其统计量的分布进行统计推断。可见非参数方法的核心含义直观,易于理解。
2. 航天产品的统计技术应用
在标准GB/Z 19027 2005 《GB/T 19001-2000的统计技术指南》中列举了常用的统计方法,并对其应用作了识别。包括描述性统计、假设检验、回归分析、可靠性分析、抽样方法等[2]。其中的诸多方法,均有其前设的适用条件,例如描述性统计描述产品数据的均值、方差等属性参数据需要基于数据服从特定统计分布的假设,否则统计结果没有意义,另外,诸如假设检验需限制数据分布种类、线性回归分析需满足三条基本的高斯假设等,表明在常用的统计技术中心,应用较多的是基于参数的统计技术。
然而在航天产品中,产品结构复杂、可靠度高、寿命周期长,导致能够采集的数据较为复杂,且呈现小子样的特点,因此通常无法适配现有的统计分布,导致统计技术应用率不高。基于此现状,本文提出应用常见的非参数统计技术,以适应无法使用参数统计技术的情形。
综上所述,非参数统计技术能够在航天产品的综合保障研究中有较好的应用,因此本文提供几种常见的非参数统计方法。
3. 常见的非参数统计技术及其应用
常见的非参数统计方法[5],有以下几种:
a) 经验生存分布函数
描述不分组的单变量生存函数的常用方法是计算和图示经验生存函数,或等价的经验分布函数,这对所研究的生存分布的生存函数或分布函数给出一个非参数估计。若在容量为n的样本中没有截尾数据,则经验生存函数(ESF)定义为
这是一个阶梯函数,若所有观测值都量量不同,则该函数在给个观测值之后递减1/n。若有d个生存时间等于t,则在过t之后ESF递减d/n。大样本理论证明了样本量趋于无穷时,经验生存分布函数依概率一致收敛于总体生存分布函数,考虑两组生存数据是否相同时,可以比较其经验生存分布函数。令对照组与处理组的生存函数分别为
与,则检验统计量为
.
该统计量被称为Kolmogorov-Smirnov(K-S)统计量。该统计量主要应用于数据完全的情形下的统计分析。
b) 乘积限估计
通过Kaplan and Meier估计进行数据不完全时生存函数的乘积限估计。该估计的定义如下:
假定有n个样品的观测,在个不同的时间发生失效,此时允许在可能有多于一个失效发生,令为时刻的失效个数,为时刻面临危险的样品数,即在时刻之前仍活着且未被截尾的样品数。的乘积限估计定义为
估计量是数项乘积构成,乘积中的每一项可以认为是恰在时刻之前仍未失效的条件下活过的条件概率。同样在样本容量趋于无穷时,该估计依概率收敛域相应生存分布。
c) Mann-Whiteny-Wilcoxon秩统计量
该统计量主要用来分析当控制组与处理组的观测值是完全的情形,考虑控制组与处理组是否有显著的差异。首先给出秩的定义。
在样本量为n的完全数据中,某一数据的秩是指该数据在该组数据从小到大排列中所对应的位置。即将n个数据按自小到大的次序编号排列成
若数据在上述排列中处于位置l,则成的秩为l,。
设来自于控制组的观测值,来自于处理组的观测值,将它们混合在一起,记在混合后的秩为。Mann-Whiteny-Wilcoxon秩统计量为
对于显著性水平,若
或
则认为控制组与处理组有显著的差异。其中临界点,分别满足
与
的最大整数与最小整数,表示置信水平下的置信下限与置信上限。
该统计量简单,易于计算,并具有较好的统计性质和较大的优势。但该统计量仅仅适用完全数据的统计分析,许多情况下面临的数据分析是不完全的,进而提出了广义的Mann-Whitey-Wilcoxon统计量。该统计量完全可以处理不完全数据。但该统计的在计算p-值时计算量比较大,通常采用其大样本分布来计算p-值。
此外,还有对数秩统计量、线性秩统计量等基于秩理念的非参数统计技术,用以评价两总体间是否有显著差异,非参数核估计方法用以进行回归分析等,通常根据实际情形选用对应的非参数统计技术。
4. 总结
从常见的几种非参数统计技术来看,非参数统计技术大多通过较为基础的理念,构造统计量,用以描述总体的不同类型特征,理论上易于理解和使用。且常用以检验不同总体之间的差异是否显著,同时也可用以进行回归分析,而在航天产品的综合保障研究过程中,产品质量,如武器系统主要性能是否发生变化通常是较为关注的重要特征,因此非参数统计技术在航天产品的综合保障研究中有较好的适用性。
因此在航天产品的综合保障研究时,当产品数据呈现示性(等级性)、总体依赖性弱(难以确定总体分布/族)、无法使用既定统计量表征问题等特征或事态紧急时,可根据实际情况选择对应的非参数统计技术进行统计推断。
参考文献
[1] 中国标准化第一编辑室. GB/T 19027-2005《GB/T 19001-2000的统计技术指南》[S].中国标准出版社,2006.
[2]孙山泽. 非参数统计讲义「M]. 北京:北京大学出版社,2000.
[3] 徐明. 两种非参数统计方法的应用[J]. 体育科学, 1997,(6):83-86.
[4] ELISA T.LEE.《生存数据分析的统计方法》.陈家鼎,戴中维译.北京:中国统计出版社, 1998;
.
,