1.7 确信可靠度
软硬件综合系统可靠性评价最初的研究主要集中在分别对软件、硬件的可靠性进行评价,进而将评价结果综合,其中的主体工作是进行各种模型的组合与匹配,但这种方法未解决软硬件故障机理不同造成影响这一问题,因此存在一定的局限性。软硬件综合系统的可靠性水平实质上描述的是其完成规定功能的不确定性,这种不确定性又主要体现为系统故障对完成功能的影响。基于概率统计的传统可靠性理论在把握可靠性水平时,将系统视为一个黑盒,对导致系统故障的确定性原因并不关注,而是通过收集、分析故障时间数据,基于统计方法对系统整体的可靠性水平进行描述。然而,随着可靠性理论逐步发展完善,这种事后反馈的传统可靠性理论的局限性日益凸显。在此背景下,出现了基于故障物理的可靠性理论,利用故障机理模型描述故障的确定性规律,利用模型参数的分散性刻画不确定因素的影响。因此,基于故障物理的可靠性理论将故障原因划分为确定性原因(以故障机理模型描述)和模型参数不确定性影响两类。但是模型参数的分散性描述的只是客观存在的不确定性,即固有不确定性,对于故障机理、所选模型是否准确这类受分析者认知状态影响的不确定性则没有考虑。显然,要想获得准确的软硬件综合系统可靠性评价结果,还需要充分考虑系统的认知不确定性。1990年,美国麻省理工学院教授Apostolakis G在《科学》杂志上撰文指出,除模型参数的不确定性之外,还存在着由建模者知识不完备导致的模型本身存在的不确定性,即认知不确定性。与之相对,客观世界内在的不确定性被称为固有不确定性。实际上,系统的故障规律受到确定性原因、固有不确定性与认知不确定性的共同影响。基于这一认识,文献[21]提出了一种综合考虑设计裕量、固有不确定性与认知不确定性三方面影响的可靠性度量指标——确信可靠度;文献[22]进一步给出了确信可靠度的计算方法;在文献[23]中,认知不确定性对系统可靠性的影响由参数“认知不确定因子”定量地表达。在工程上,认知不确定性对系统可靠性的影响已经得到了广泛的重视。事实上,很大一部分与系统可靠性相关的工程活动的目的就是降低认知不确定性的影响。例如,进行FMEA。通过FMEA可以确定各个单元可能发生的故障的模式及其对系统的影响,从而采取针对性的改进措施,减少由对单元故障模式认识不清带来的可靠性问题。对软硬件综合系统而言,若在FMEA过程中不仅考虑硬件故障的影响,还充分考虑软硬件综合系统故障的影响,则可以进一步降低认知不确定性。
确信可靠性理论以不确定理论和机会理论作为理论基础。不确定理论是由刘宝碇教授在2007年提出的一种基于不确定测度的理论,不确定测度服从规范性公理、对偶性公理、次可加性公理、乘积公理四个基本公理。机会理论可以看成概率理论和不确定理论的交叉理论,它的基本测度是由概率测度和不确定测度交叉而得到的。由于不确定测度服从对偶性公理和乘积公理,确信可靠性理论在对可靠性进行度量时可以克服上述方法中存在的对偶性问题及指标衰减过快的问题,因此确信可靠性理论更加适合对工程中受到认知不确定性影响的可靠性进行度量。