第二章 坦克装甲车辆可靠性理论基础
第一节 理论基础
一、可靠性的基本概念
1.可靠性的定义
可靠性是指产品在规定的条件下和规定的时间内,完成规定功能的能力。
在将这个定义应用到具体产品时,要特别注意这3个规定和1个能力。
(1)规定的时间 规定的时间是可靠性定义中的核心,因为不谈时间就无可靠性而言,而规定时间的长短又随着产品对象不同和使用目的不同而各异。例如,对发射卫星的运载火箭的要求是在几十秒或几分钟内可靠;对坦克装甲车辆的要求是在几万小时或几十年内可靠。一般来说,产品的可靠性是随着产品使用时间的延长而逐渐降低的。因此,一定的可靠性是对一定时间而言的。
(2)规定的条件 规定的条件一般是指使用条件、维护条件、环境条件和操作技术。对坦克来讲,由于其长期训练、机动作战、定期检测及可维修的特点,还特别规定了使用:环境条件、运输条件、检测周期及维修条件、保障条件等。
这些条件对产品的可靠性都会有直接的影响,在不同的条件下,同一产品的可靠性也不一样。例如,实验室条件与现场使用条件就不一样,其可靠性有时可能相近,有时可能会相差几倍到几十倍。因此,不在规定的条件下谈可靠性就失去了比较产品质量的前提。
(3)规定的功能 规定的功能一般用产品的各种性能指标来刻画。通过试验,产品的各项规定的性能指标都已达到,则称产品完成了规定的功能,否则,则称该产品丧失规定的功能。今后我们把产品丧失规定功能的状态叫做产品发生“故障”或“失效”,相应的各项性能指标就叫做“故障判据”或“失效判据”。在具体进行可靠性工作中,合理、明确地给出“失效判据”是很重要的,否则对可靠性问题就会争论不休。
(4)能力 只是定性地理解“能力”是不够的,必须对它有定量的刻画,以便说明产品可靠性的程度。这对提高产品可靠性、比较同类产品的可靠性都是重要的依据。由于产品在工作中发生故障具有偶然性,所以不能仅看一个产品的工作情况,而是应该在观察大量同类产品之后,确定其可靠性的高低。因此,在可靠性定义中的“能力”就具有统计意义。例如,产品在规定的时间内、规定的条件下,失效数与产品总数之比越小,其可靠性就越高;或者产品在规定的条件下,平均无故障工作时间越长,其可靠性也越高。由于可靠性所研究的产品是相当广泛的、各种各样的,因此用来度量产品可靠性的“能力”也是多种多样的。这里的“能力”通常是指各种可靠性指标,常用的可靠性指标有“可靠度”、“平均寿命”、“失效率”等,这些可靠性指标构成了可靠性的基本概念。
从以上对可靠性概念所作的解释可以看出,可靠性就是在上述3个规定下,研究产品发生失效的统计规律性,从而为评定产品的可靠性、确定薄弱环节、排除故障、提高可靠性提供依据。
2.失效分布函数与平均寿命
(1)失效分布函数 产品丧失规定的能力称为失效,或称为故障。产品从开始工作到首次失效前的一段时间T称为寿命。由于产品发生失效是随机的,所以寿命T是一个随机变量。不同的产品、不同的工作条件,寿命T取值的统计规律是不同的。设寿命T的分布函数为F(t),记为
F(t)=P(T≤t)
它表示在规定的条件下,产品的寿命不超过t的概率,或者说,产品在t时刻前发生失效的概率。可以看出,分布函数是取值在[0,1]内的点函数,并且有以下性质:
③分布函数F(x)是非降函数,即x1<x2时,有F(x1)≤F(x2)。
综上所述,任一分布函数F(x)都是一个由0不断增加到1的非降函数。
对可靠性而言,寿命T的分布函数F(x)常称为失效分布函数,或称为寿命分布函数。确定一种产品寿命的失效分布函数是一件非常重要和非常基础的工作,因为以后的统计推断大多以此为基础。
概率可以用频率来解释,失效概率也可以采用频率来解释。例如,F(1000)=0.05意味着在0~1000h内,平均100件产品中大约有5件失效,还有95件产品的寿命大于1000h。反过来,也可以用频率去估计概率。假如在t=0时刻有N件产品开始工作,而到t0时刻有n(t0)件产品失效(见图2-1),则可以用频率去估计时刻t0的失效分布函数值F(t0)。
图2-1 失效分布函数
假如寿命T是一个连续型随机变量,那么其密度函数f(t)= F'(t),称为失效概率密度函数,简称失效密度。我们通常说的“失效分布”,常指失效分布函数;假如它有密度函数,也可指失效密度。因为这二者之一确定了,产品寿命的统计规律也就完全确定了。
由于寿命T的取值总是非负实数,故对t<0,总有F(t)=0[或f(t)=0]。因此在以后给定失效分布时,只要对t≥0给出即可。
(2)平均寿命 设产品寿命T的失效概率密度函数为f(t),那么它的数学期望 (均值)
称为产品的平均寿命。平均寿命是一个标志产品能工作多长时间的量,不少产品,如常用平均寿命作为可靠性指标。人们可以从这个指标直观地了解一种产品的可靠性水平,也容易比较两种产品在可靠性水平上的高低。平均寿命这个可靠性指标不是针对单个产品而言的,而是针对整批产品而言的概念。而实际需要的正是对整批产品而言的可靠性指标。其他的可靠性指标也都如此。
产品大体可分为两类:一类是不可修复的产品,如灯泡、晶体管、轴承等;另一类是可以修复的产品,如坦克装甲车辆。对不可修复的产品,平均寿命就是平均寿终时间,记为MTTF。对可修复的产品,平均寿命是指平均无故障工作时间,记为MTBF。假如我们仅考虑首次失效前的一段工作时间,那么两者就没有什么区别了。
产品的平均寿命(MTTF或MTBF)一般都是未知的,特别是在产品的失效分布未知的情况下,如何来估计产品平均寿命呢?一般是通过寿命试验,用获得的一些数据来估计的。由于可靠性寿命试验往往是破坏性的,故只能抽取部分产品进行寿命试验。这部分产品常称为子样,其中,每一个产品称为样品。
如果从样品中抽取n个产品,经过寿命试验获得各样品发生故障的时刻分别为t1,t2,…,tn,那么n个数的算术平均值
就可用来估计该批产品的平均寿命。
对于平均寿命的估计,要注意以下几点。
①从整批产品中抽取样品要随机化,即整批产品中每一个产品都以同等的概率被抽到。只有这样才能使获得的子样代表整批产品,从而获得的算术平均值才能代表整批产品的平均寿命。假如只在优等品中抽取样品,那么获得的算术平均值是不能代表整批产品的平均寿命的。要做到这一点,在技术上没有什么难度,难处在于排除人为因素的干扰。
②样品抽多少为宜,不宜划一。一般说来,子样愈大,估计结果愈精确,但也要考虑到经济问题和试验设备问题。对价格低、试验费用小的产品,子样可以抽得多一些;对价格高、试验费用多的产品,子样可抽得少一些;对元器件子样可抽得多一些,对整机子样可抽得少一些;对可修复产品子样可抽得多一些,对不可修复产品子样可抽得少一些。
③对于某些产品,即使子样不太大,但要等全部试验都做完 (称为完全样本试验)再估计平均寿命,那就需要等很长时间。有时不等试验全部做完,而只是部分样品失效(如50%失效、60%失效等,这一类寿命试验称为截尾寿命试验),就要对平均寿命做出估计。这时就不能用子样的算术平均值去估计平均寿命,而要用另外的估计公式;这些公式的推导就要用到产品的寿命分布。
3.可靠度函数与可靠寿命
(1)可靠度函数 “可靠性”这个词有广义的和狭义的两种解释。把“可靠性”看做一门学科,也即广义的解释,是指“产品在规定的条件下和规定的时间内,完成规定功能的能力”假如把“可靠性”看做一个质量指标,那么是指“产品在规定的条件下和规定的时间内,完成规定功能的概率”。两者间的差别仅在于后者把“能力”换成“概率”。为了区别这两种解释,通常把可靠性的狭义解释称为可靠度。
产品在规定的时间t内和规定的条件下,完成规定功能的概率称为产品的可靠度函数,简称可靠度R(t)。
从这个定义不难导出可靠度函数的数学表达式。设T是产品在规定条件下的寿命,F(t)是它的失效分布函数,此时下列3个事件是等价的:
①产品在时间t内完成规定的功能;
②产品在时间t内无失效;
③产品的寿命T大于t。
于是产品的可靠度函数R(t)可以看做是事件T>t的概率,即
这个概率也可以用频率来解释。例如R(1000)=0.95意味着在 1000h内,平均100件产品大约有95件产品能完成规定的功能,而大约有5件产品发生了故障。反过来,也可以用频率去估计概率。假如在t=0时有N件产品开始工作,而到t时刻,有n(t)件产品失效,N-n(t)件产品在继续工作(见图2-2),则频率
可作为时刻t的可靠度函数值的估计值。
图2-2 可靠度函数
假如已知产品的失效分布函数为F(t),那么可靠度函数R(t)可从F(t)求出,这是
因为
或R(t)+F(t)=1
图2-3显示了R(t)与F(t)之间的关系。再由分布函数的性质可得到R(t)的性质,即:
③R(t)是t的非增函数。
图2-3 R(t)与F(t)之间的关系
假如寿命T是连续型随机变量,其失效密度函数为f(t),则有
从上述讨论可以看出,可靠度函数R(t)可以由失效分布函数F(t)或失效密度函数f(t)完全确定。反之,由R(t)也可以唯一确定相应的F(t)和f(t)。因此,R(t)与F(t)和f(t)一样可以用来描述寿命T取值的统计规律。对可靠性而言,给出R(t)就等价于给出了其失效分布。
平均寿命E(T)也可直接从可靠度R(t)求得,假如可靠度R(t)满足tli→m∞(tR(t))=0,那么利用分部积分法可得
这个结果表明,平均寿命在几何上等于R(t)与时间轴t所夹的面积。
(2)可靠寿命 设产品的可靠度函数为R(t),使可靠度等于给定值r的时间t称为可靠寿命。
可靠度函数R(t)是时间t的非增函数。在开始工作时t=0,有R(0)=1;随着工作时间的增加,R(t)逐渐下降。反之,若知道了可靠度函数,则对于给定的可靠度r,可求得产品可靠度降到r的时间。这个时间称为可靠寿命,r称为可靠水平,满足
R(tr)=r
特别地,可靠水平r=0.50的可靠寿命t0.50称为中位寿命,可靠水平r=e-1的可靠寿命te-1称为特征寿命。
从定义中可以看出,产品工作到可靠寿命tr,大约有100(1-r)%产品已经失效;产品工作到中位寿命t0.50,大约有一半失效;产品工作到特征寿命te-1,大约有63.2%产品失效。
在讨论试验方案时,人们对被验证产品的B10寿命比较感兴趣,因为产品的B10寿命是人们比较关心的寿命,是在产品可靠性设计中经常使用的。
B10寿命就是产品可靠度为90%的可靠寿命t0.90,也就是产品仅仅发生10%失效所对应的寿命长度,于是有t0.90=B10。
4.失效率函数
(1)失效率的概念 产品的失效率是可靠性理论中的重要概念,在实践中它又是可靠性的重要指标,不少产品就是用失效率来确定其等级的。已工作到时间t的产品,在时刻t后单位时间内发生失效的概率称为该产品在时刻t的失效率函数,简称失效率,记为λ(t)。
先把上述定义中的概率理解为频率,对失效率概念作一些直观的解释,便于正确地理解它的含义,然后再来推导失效率的数学表达式。
设在t=0时有N个产品开始工作,到时刻t有n(t)个产品失效,还有N-n(t)个产品在继续工作,为了考察时刻t后产品的失效情况,再观察Δt时间。假如在t到t+Δt时间内又有Δn个产品失效(见图2-4),那么在时刻t尚有N-n(t)个产品继续工作的条件下,在时间(t,t+Δt)内失效的频率为
图2-4 失效率的概念
于是产品工作到时刻t之后,每单位时间内发生的失效的频率为
这个量可以用来估计在时刻t的失效率λ(t)。由于频率有稳定性,所以当N愈大,Δt愈小时,这个估计就愈精确。
从上述分析中看出,讲失效率是有条件的,“产品工作到时刻t后”就是条件。式(2-9)分母中的N—n(t)就是随着这种条件的变化而变化。因而失效率能非常敏感地反映出产品失效的变化速度。若无此条件,那么产品的失效频率不是,而是,这时
可以用来估计在时刻t的失效概率密度函数f(t)。虽然f(t)也能反映产品失效的变化速度,但不够敏感。因为式(2-10)分母中的N是不变的,能引起f(t)变化的只有Δn,所以它不如失效率能敏感地反映产品失效的变化速度。
下面将失效率的定义推出失效率λ(t)的数学表达式。
设T是在规定条件下产品的寿命,其失效分布函数为F(t),密度函数为f(t)。此时,事件“产品工作时刻t后”可表示为T>t,事件“产品在(t,t+Δt)内失效”可表示为t<T≤t+Δt;于是产品到时刻t后,在(t,t+Δt)内产品失效的概率可表示为条件概率P(t<T≤t+Δt|T>t);把此条件概率除此时间间隔Δt以后,就得到Δt时间内的平均失效率;当Δt→0时,就得到在时刻t的失效率
由条件概率性质和事件包含关系,可知
于是有
进一步还可推得
式(2-13)和式(2-14)都是失效率的数学表达式。从这些关系式中可以看出,假如已知失效分布函数F(t)或f(t)或可靠度函数R(t),都可以导出λ(t)。总之,知道了产品的失效分布,就可以确定失效率函数λ(t)。
反之,假如已知产品的失效率λ(t),那么也可以求出产品的失效分布,这是因为可靠度函数R(t)满足下列微分方程
两边对t积分可得
于是有
这些结果是很重要的,它不仅给出了从失效率λ(t)推出失效分布函数F(t)和f(t)的具体公式,而且还说明λ(t)与F(t)、f(t)、R(t)一样重要,都是全面地描述产品寿命T取值规律的;它们之间是相通的,只是各个概念着重说明的侧面不一样,从而用途也就不一样。
(2)失效率的单位 从失效率的估计公式可以给出失效率λ̂(t)的公式为
其单位为%/h。
(3)产品的失效规律 人们在各种产品的使用和试验中得到大量的数据,对它进行统计分析之后,发现一般产品的失效率λ和失效时间t的关系曲线有如图2-5所示的形式。这条曲线通常被称为浴盆曲线,它明显地分为3段,对应着产品的3个时期。
图2-5 产品的失效率λ和失效时间t的关系
①早期失效 早期失效的特点是失效率非常高,但随着产品工作时间的增加,失效率迅速降低。这一阶段产品失效的原因大多是由于设计和制造过程中的缺陷造成的。
使产品的失效率达到偶然失效期的失效率水平的时间称为交付使用点。承制方为了尽快达到交付使用点,常常采用合理的筛选技术和负荷试验,或者用其他方法将这些有缺陷的不可靠的产品尽快暴露出来,使余下的产品具有较低的失效率;一旦达到交付使用点的失效率水平,产品就可以出厂,并交付使用。
②偶然失效 偶然失效期也称随机失效期或稳定工作阶段。这是产品(特别是整机)的最良好的工作时期。这一阶段的特点是失效率较低且比较稳定,往往可以看做是常数。在这一阶段内,产品失效常常是由于多种因素造成的;而每一种因素都不太严重,因此失效纯属偶然。在这一阶段要尽力做好产品的维护和保养工作,使这一阶段尽量延长。假如不注意这一点,就会使更新点提前到来。
③耗损失效期 “耗损失效期”是从材料的老化或机械磨损而引申到可靠性领域来的。耗损失效期的特点是失效率随时间延长而急速增加;到了这一阶段,大部分产品都开始失效,这时可针对不同情况采取一些补救措施。
5.任务可靠性与基本可靠性
(1)任务可靠性与基本可靠性的概念 任务可靠性与基本可靠性是在可靠性的发展中先后形成的两个概念,它们既有相同点也有不同点。
①任务可靠性 产品在规定的任务剖面中完成规定功能的能力称为任务可靠性。任务剖面是指产品在完成规定任务这段时间内所经历的事件和环境的时序描述,其中包括任务成功或失效的判断准则。
②基本可靠性 基本可靠性是指产品在规定条件下无故障的持续时间或概率,反映了产品对维修人力的要求。在确定基本可靠性的特征量时,应统计产品的所有寿命单位和所有的故障,而不能局限于发生在任务期间的故障,也不能局限于只危及任务成功的故障。
(2)任务可靠性与基本可靠性的区别 从任务可靠性和基本可靠性的定义可知,任务可靠性与基本可靠性主要有以下区别。
①寿命单位的统计不一样 在计算任务可靠性时,只统计完成任务的过程中所包含的寿命单位,而把该产品在执行该次任务前的经历作为条件;在计算基本可靠性时,必须统计整个寿命剖面内(或规定的时间内)所包含的寿命单位。
②故障的统计不一样 在计算任务可靠性时,只统计危及任务完成的故障。在计算基本可靠性时,凡是需要维修的故障,不管它是否危及任务成功,均要进行统计。
③计算模型不一样 在计算任务可靠性时,应根据产品真实的数学模型进行计算。因此,就可能有多个计算模型。
在计算基本可靠性时,一律按串联模型计算,显然只有一个计算模型。
6.固有可靠性与使用可靠性
(1)固有可靠性与使用可靠性的概念
①固有可靠性 由产品的设计、制造所决定的可靠性称为固有可靠性,它假设使用条件是理想的。显然,产品的固有可靠性也是产品的固有属性,一旦产品的设计定型,制造工艺定型,产品的固有可靠性就是确定的值。
②使用可靠性 由产品的设计、制造、安装、贮存、运输、使用等综合因素决定的可靠性称为使用可靠性。产品的使用可靠性应是使用方和研制方共同关心的焦点。
(2)固有可靠性与使用可靠性的区别 由固有可靠性和使用可靠性的定义可知,产品的固有可靠性与使用可靠性是不相同的,主要是因为产品设计、制造所依据的条件不可能与实际使用条件完全相同,同时也可能在生产中偏离了设计定型、制造工艺定型所规定的要求,如某些原材料、元器件的代用及操作工人技术水平差别引起的制造工艺差异等,都会使产品的固有可靠性发生变化。
7.条件概率、全概率公式与贝叶斯公式
(1)条件概率 对许多问题的研究,往往是在某些事件已发生之后才进行讨论的,那么在事件发生前和发生后来讨论同一问题时可能会由于条件的变化而得出不同的结果。
算得的概率实际上是“在已知事件B发生的条件下,事件A发生的概率”,这个概率称为条件概率,记为P(A|B)。
下面给出条件概率的定义。
设A和B为随机事件,P(B)>0,则称
为在事件B发生的条件下,A发生的条件概率。
由式(2-21)可得到
若还有P(A)>0,则也可定义P(B|A)这时有
(2)全概率公式 在可靠性研究工作中常常要遇到一些复杂事件的概率计算,为了解决这些问题,经常先把一个复杂事件分解为若干个不相容的简单事件,再分别计算这些简单事件的概率,最后利用概率的可加性得到最终结果。这里,全概率公式起着很重要的作用。
设事件A1,A2,…,Ai,…是样本空间Ω的一个分割,即Ai两两互不相容,P(Ai)>0,i=1,2,…,而且
则对任一随机事件B,有
这里AiB也两两互不相容。
由概率的完全可加性
再由式(2-23)得
式(2-27)称为全概率公式。
(3)贝叶斯(Bayes)公式 全概率公式是借助于一组完备事件组{Ak}来求某一事件B的概率,而贝叶斯公式则与之相反,是在已知某一事件B已发生的条件下,求完备事件组中某个Ak发生的条件概率,具体表述如下。
设{Ak}为完备事件组,即满足以下条件:
或P(B)>0,则对任意的k(1≤k≤n)有
【证明】由式(2-23)得
P(AkB)=P(B)P(Ak|B)=P(Ak)P(B|Ak)
从而有
对P(B)再用全概率公式(2-27)代入,即得式(2-28)。
贝叶斯公式在可靠性分析中应用很广泛。
二、可靠性指标体系
由于产品的多样性导致可靠性参数的多样性,对于那些复杂的多功能系统的产品需要建立一个可靠性指标体系,从不同的侧面全面地描述产品的可靠性。
1.指标体系的定义
在产品可靠性设计和管理过程中,为使产品在运行中能够完成或达到所规定的功能,并通过维修保持这种功能,要对产品提出可靠性和维修性要求,并将这些要求用一组能反映产品能力的可靠性与维修性指标定量描述,这组可靠性与维修性指标的组合为系统的可靠性与维修性指标体系。
2.指标体系选取的原则
(1)指标体系的完备性 在可靠性与维修性指标体系中,所有选定的指标组合在一起能完整地描述产品可靠性与维修性要求的各个方面,对坦克装甲车辆来讲,即在战备完好、任务成功、维修人力费用和后勤保障费用等方面的要求。
(2)指标体系的阶段性 当产品是一个复杂系统时,其任务剖面往往不止一个,应将产品的任务过程划分为不同的阶段,对每一个任务阶段应有相应的可靠性与维修性指标和指标值,不同阶段的指标和指标值可以不同。例如对坦克,在定型、批产品交付、定期检测及训练、作战应用各阶段均可提出不同的可靠性指标和指标值的要求。
(3)指标体系的层次性 一个复杂的系统,一般是由若干个不同功能的子系统构成的;而子系统又可以根据其功能、特性继续分解。对每一分解层次上的功能子系统,都需要给出相应的可靠性与维修性指标。由于各个子系统的功能不同,所选取的指标也就不同。
(4)指标体系的适应性 指标系统的指标应与系统所要完成的任务、规定的功能及可能发生的故障模式相对应。例如,对于一个不可修系统,只需要提出可靠度指标;而对于一个可修系统,则不仅要提出可靠度指标,还需提出维修性指标。
(5)指标的可达性 指标应对系统可靠性起指导作用,在使用方向研制方提出的指标要求中应尽量排除一些研制方无法控制的因素。例如使用可靠度A0,不仅与产品的保质期T0、测试时间Tc、维修时间Tm有关,还与测试延迟时间Tcl、维修延迟时间Tml有关,而测试延迟时间Tcl和维修延迟时间Tml是产品使用中的管理工作造成的,研制方无法控制。因此,指标中不提使用可用度而提固有可用度。
(6)指标的可检验性 指标体系中所提出的各项指标应该都是可检验的。如果仅是提出而不进行检验,这些指标就根本不会落实。有些指标需要较多的试验子样才能得到检验,这时可把达到指标要求划分为几个阶段;在定型时只需达到最低可接受值,并作出安排,保证其最终能验证达到所需指标要求。
(7)指标参数间的相关性 有的可靠性参数相互间是相关的,在选择时要注意其内在关系,以免相互矛盾。