上QQ阅读APP看书,第一时间看更新
第二节 正确度和精密度
一、准确度
1.准确度(accuracy)
是测量结果中系统误差与随机误差的综合,表示测量结果与真值的一致程度。
A=ε+Δα
式中 A=准确度;
ε:已定系统误差的综合;
Δ α:在显著性水平为α时,未定系统误差和随机误差合并后的不确定度。
准确度不能以数字表达,它往往以偏倚和不精密度来衡量。
在单次测量时,每个测量都会显示出某种不准确的程度,即它与真值的偏离。实际上,一个即使没有系统误差的测量系统也不可能产生准确的单次测量值,因为随机误差为零的概率是零。
2.正确度(trueness)
无穷多次重复测量所得量值的平均值与一个参考量值间的一致程度。
正确度表示测试结果中系统误差的大小,通常以偏倚来度量。
我们应这样来理解上述的概念。我们日常测试的结果与真值(主要是约定真值)间的一致程度,应称为准确度。不能因为我们的测试结果是两次或几次测试的平均就认为它是正确度。而正确度所指的若干次应理解为由很大一个系列所得测试结果的平均值与真值(主要是约定真值)间的一致程度。
准确度常用误差来表示,而正确度常用偏倚来表示。
在实际检验工作中我们常用标准物质(referencematerial,简称RM,具有一种或多种充分确定了的特性,用以校准设备、计量方法评估或给物质赋值的物质或材料)作为约定真值来考察我们检验结果的准确程度。而标准物质又是经一些有权威性的检测技术水平较高的实验室,采用经典的测试方法和先进精密的测试仪器,对同一试样进行重复多次测定,求出的一系列检验结果,得出它的“真值”。但实际上它仍具有一定的误差。也有是用经权威机构公认的方法做的结果作为“真值”。
3.测试的偏倚(bias of a test)
测试的结果的期望与真值之差。偏倚是一种或几种系统误差所引起的。
目前国内外不少行业现场操作者对偏倚一词还有些模糊概念。如在质检、煤炭、电力、冶金等行业在进行煤炭和矿石机械采样设备的性能验收时,国际标准都规定需进行“tests for bias”,即偏倚试验。而我们从20世纪80年代就把它翻译为偏差试验,至今大家仍在沿用这一术语。随着机械采样设备在我国的普及,这一术语使用的愈加频繁。实际上这是两个不同的概念,偏差是指观测值对于某个中心值之差,而偏倚则是期望与真值之差,是由一种或几种系统误差所引起的。而机械采样设备所采样品需要经多级切割与缩分,有可能由某一级或不同级不同部件设计不合理而引起的系统误差。因而应称为偏倚试验,不应再称它为偏差试验。
二、精密度
精密度(precision)表示测量结果中的随机误差大小的程度。精密度是指在一定条件下进行多次测定时,所得测定结果之间的符合程度。
测量过程应该足够精密,才能在使用时达到最少的重复测量次数。非常精密的测量系统仅需要一次测量就能满足要求。精密度差的测量系统即使增加重复次数也不会明显改善精密度。
精密度无法直接衡量,往往以不精密度表达,常用标准差表示,较小的标准差表示有较高的精密度。可用一个样本的重复测定结果,或由多个样本多次重复测定所得的信息合并在一起来估计精密度。
1.重复性、重复性条件、重复性标准差、重复性限、重复性临界限
重复性(repeatability)在重复性条件下,相互独立的测试结果之间的一致程度。
重复性条件(repeatability conditions)在同一实验室,由同一操作者使用相同设备,按相同的测试程序,并在短时间内对同一被测试对象相互独立进行的测试条件。
重复性标准差(repeatability standard deviation) 在重复性条件下,所得测试结果的标准差。
可同样定义重复性方差与重复性变异系数。
重复性限(repeatability limit)一个数值r,在重复性条件下,两次测试结果之间的绝对值不超过此数的概率为95%。
重复性临界差(repeatability critical difference)一个数值在重复性条件下,两个测试结果或两组测试结果计算所得的最后结果(例如平均数、中位数等)之差的绝对值以一个确定的概率不超过此数。
在此应注意的是,以往一些教科书及日常化验的习惯用语中的“平行试验”一词,现在应当把它理解为重复性实验,因为即便是我们认为的平行试验在称量、测试等程序上特有先后短时间的时间间隔,因此建议慎用“平行试验”一词,重复性标准差记作s,当已知重复性限r时,s r= r/2.8。
目前不同行业的一些标准中,对上述术语的使用有些不甚规范,一些检验方法标准在精密度条款栏下,有时仍用重复性、再现性;有的用重复性限、再现性限;还有的使用再现性临界差等不同术语。
2.再现性、再现性条件、再现性标准差、再现性限、再现性临界差
再现性(reproducibility)在再现性条件下,测试结果之间的一致程度。
同义词:复现性
再现性条件(reproducibility conditions)在进行测试的实验室,操作者、测试设备、测试程序(方法)、测试时间有所本质变化的情况下对同一被测对象相互独立进行的测试条件。
同义词:复现性条件
在确定再现性(复现性)报告中,应当指明再现条件中变动的情况。
再现性标准差(reproducibility standard deviation)在再现性条件下,所得测试结果的标准差。
可同样定义再现性方差与再现性变异系数。
再现性限(reproducibility limit)一个数值R,在再现性条件下,两次测试结果的绝对值不超过此数的概率为95%。
再现性临界差(reproducibility critical difference) 一个数值,在再现性条件下,两个测试结果或两组测试结果计算所得的最后结果(例如平均数、中位数)等之差的绝对值以一个确定的概率不超过此数。
同义词:复现性临界差
再现性标准差记作s R,当已知再现性限时s R=R/2.8。
重复性限与重复性临界差以及再现性限与再现性临界差的区别在于前者为两次测试结果之差,后者是两列(列中也可能只有一个测试结果)测试结果之差。
另外还应注意再现性限R的值总是大于或等于重复性限r,因再现性的测试结果把重复性引起的变异也考虑进去了,再现性实质上代表了重复性的另一个极端。
3.试验数据精密度的几种表达方式
精密度的表示根据不同的场合和不同的需要,可用极差、平均偏差、标准差、方差和变异系数等方式表达。
(1)极差(range):
样本中最大值与最小值之差:x max-x min。即指一组观测值中最高值与最低值之差。一般为字母R表示。
极差是一个快速而简便地表示精密度的指标。但它只取决于两个极端值,既同测定次数无关,又同其他所有的中间值无关。因此,它不能全面地反映出检测的精密程度。
极差不仅能够表示数据的离散程度,它还有其他一些用途,如用极差绘制质量控制图,用极差判断分析值的取舍,用极差确定均值的置信区间。
(2)偏差(deviation):
指观测值对于某个中心值的差,即检测值相对于平均值的差异。偏差与误差是两个不同的概念。
与误差的表示方法一样,偏差也有两种表示方法,即绝对偏差和相对偏差。
1)绝对偏差d i(absolute deviation):测量值X i与多次测量的均值 之差:d i= x i-
绝对偏差的单位与测量的单位相同。在均值检验、方差分析、采样、制样误差的检验中需先计算出绝对偏差来。
2)相对偏差(relative deviation):是绝对偏差与均值之比,通常以百分数表示:
(3)平均偏差δ(mean deviation):
又称算术平均偏差,是观测值距某个中心值偏差的算术平均值。其中所有的偏差都取其正值。即各次测量值偏差的绝对值之和除以测量次数。
同极差相比,平均偏差能较好地反映测量的精密度。因为它既考虑了测量的次数,又考虑了所有各次的观测值。但它也存在一定的缺点,它对特大、特小的偏差不够敏感。
(4)标准差(standard deviation):
又称标准偏差,它是方差的正平方根。它是表示精密度和数据离散程度最主要的指标。
计算公式为:
通常随机变量或总体的标准差用符号σ表示,样本的标准差用符号s表示,标准差与平均偏差相比,对特大的偏差和特小的偏差具有更高的敏感性,这样能更好地说明数据的精密度。
标准差在实验室日常的数据处理中是最常用的一项指标,它不仅可用于衡量精密度,也是表示随机变量离散特征的重要指标。因此,在临床检验、质量控制中常用来表示质量稳定性。
(5)方差(variance):
观测值距离算术平均值的平均平方偏差。
根据所考虑情况的不同,可以将距离算术平均值的平方偏差用偏差的个数除或用偏差的个数减1除。因此对于n个观测值x 1,x 2,…x n算术平均值为
方差可用以下两个公式之一表示:
通常随机变量或总体的方差用符号σ 2表示,公式用前者。样本的方差用s 2来表示,公式用后者,这是因为s 2是σ 2的无偏估计量的原因。
(6)差值平均值 (meanofthedifference):
指一系列检测值与均值的差值的平均。
注意,它与平均偏差δ不同 是各项正负差值大小相加的平均,δ是各差值绝对值相加的平均。因此d可显示出总体的系统误差,所以在假设检验的均值检验中得到广泛的应用。
(7)变异系数CV(coefficientofvariation):
又称相对标准偏差,亦称CV值。是标准差与算术平均值之比。通常以百分数表示,公式为:
标准差是表示数据离散程度的一种特征数,但它只与各个检测值的离均差大小有关,而与各个检测值本身的大小无关。这样就不能客观地反映出不同检测值精密度的高低。
示例:甲、乙两人分别测试两种含量不同的样品,三次的测试结果如下:
甲:10,11,12
乙:20,21,22
问甲乙两人测试的精密度如何?
解:甲: =11 s 1=1 CV=9.09%
乙: =21 s 2=1 CV=4.76%
若用标准差来表示精密度,甲、乙两人的精密度相同。显然与事实不符,事实上乙的精密度明显好于甲。若用变异系数则可清楚地表明,乙的精密度高于甲的精密度。这也说明了一个问题,就是在用标准差进行精密度比较时,必须要在各组检测值大体一致的情况下进行。在纺织品的检验业务中,把变异系数称为均方差不匀率,在机械采样设备中,样品的重量变异系数是一项重要的考核项目。
综合示例:有一标准物质含某成分量为1.10,现测定5次,其结果分别为1.12,1.15,1.14,1.13,1.15。试求其绝对误差、相对误差、极差、平均偏差、标准偏差、变异系数及方差值?
三、正确度与精密度关系
准确度、正确度与精密度虽然概念不同,但是它们之间却有密切的关系。准确度是由系统误差和随机误差所决定的,而精密度是由随机误差决定的。在检测过程中,虽然有很高的精密度,但并不能说明试验结果准确。只有在消除了系统误差之后,精密度和准确度才是一致的。此时精密度越高,准确度也就越高。下面用打靶的例子来说明这两个概念之间的关系。图3-2中绘制出了四种打靶的结果及误差分布曲线。其中靶心可当作真值,弹孔与靶心的距离为误差。
从图3-2中可看出:图(a)精密度与正确度都不好。既有系统误差存在,随机误差又很大。图(b)精密度不好,但正确度还可以,这显然是由于偶然的巧合而已,由于离散程度很大,无法保证检验结果的可靠性。图(c)精密度虽好,但存在系统误差,因而正确度不好。(d)精密度高,正确度高,无系统误差,随机误差也小。
图3-2 正确度与精密度关系图
由此可知,要使正确度高,精密度一定要高,精密度高是保证正确度高的前提;但精密度高,不一定正确度高,检验人员必须经常采取比对试验,校准仪器等方法,消除系统误差,才能保证检验的准确度。
长期以来,使用准确度来表示所测结果是否准确,但从上述定义可以了解这是很难的,因为实际上人们无法知道“真值”,而且不同次测定结果又会受到精密度的影响。近来导入“测量不确定度”新概念,并引起了热烈的争论,且越来越为人们所接受,例如在最新的ISO导则17025“5.4.6测量不确定度的评定”中就提出实验室要进行不确定度的测量。