第二章 误差分析
在实验工作中,由于仪器的精密度、实验方法的可靠程度和实验者的工作态度及感官限度等各方面的主客观原因,使任何一种测量结果总是不可避免地存在一定的误差(或者偏差)。因此,必须分析和研究误差产生的原因及规律,科学地处理实验数据,判断测量结果的可靠程度,找出误差产生的原因,从而对该实验提出合理的改进。
一、误差分析的基本概念
1.物理量的测量
从测量方式上来说,测定各种物理量的方法一般可分为以下两类。
(1)直接测量
一般来说,使用仪器直接测定数据的方法,称为直接测量。用仪器进行测量时,一种情况是由仪器的刻度读取数据,例如用水银温度计测量某系统的温度、用尺子测量长度等。另一种情况是仪器通过一系列的内部程序运行或一定结构的设计而显示的数据,例如用分光光度计测定某溶液的透光率、用自动旋光仪测定蔗糖的旋光度等。
(2)间接测量
有些物理量不能直接用仪器测定,而要根据其他仪器直接测定的数据,通过一些函数公式计算而得到,这种测量方法称为间接测量。例如燃烧热的测定,是通过仪器直接测定的质量、温度及查阅的热容数据,利用有关公式计算出来的。
2.真值、平均值和可靠值
(1)真值
真值是指在一定条件下,体系某个性质客观存在的真实数值。虽然真值是客观存在,但由于种种主客观条件的限制,是不可能直接测定出来的。
(2)平均值
在实际测量中,往往在所测定的数据中,用统计的方法去获得一个最佳数据。最常用的是平均值。常用的平均值有以下几种。
设在一定条件下对某一个物理量进行n次测量,所得的结果为x1、x2、x3、…、xn。
①算术平均值
(Ⅰ-2-1)
②均方根平均值
(Ⅰ-2-2)
③几何平均值
(Ⅰ-2-3)
④加权平均值 在所测量的物体中,若各种成分对平均值的权重是不相同时,采用加权平均值。
(Ⅰ-2-4)
式中,wi是加权因子。
以上几种平均值中,算术平均值最常使用。
(3)可靠值
如果在测量过程中存在各种误差因素,平均值是不可靠的。只有尽量消除了各种误差因素,才能得到准确值。一般情况下,我们将经过权威部门检测或专家认可的文献值、核心刊物发表的论文值作为可靠值。如果不存在系统误差,而且在重复测定某数据次数足够多的情况下,通常可将平均值看作可靠值,当作真值处理。
3.误差与偏差
(1)误差
误差是测定值与真值的符合程度,它表明了测量数据的可靠性。即
误差=测定值-真值 (Ⅰ-2-5)
如上所述,一般将可靠值当作真值处理。
(2)偏差
偏差是测定值与平均值的符合程度,它不一定能说明测定的可靠性。即
偏差=测定值-平均值 (Ⅰ-2-6)
在实际工作中,如果误差不大而测定要求不太高,有时将偏差当作误差处理,不再严格区分误差与偏差的概念。
4.误差的分类
根据误差的来源和性质,可以将测量误差分为系统误差、随机误差、过失误差三大类。
(1)系统误差
系统误差指在相同条件下,多次测量某一物理量时,误差的绝对值和符号保持相对恒定,在改变条件时,会按某一确定规律变化的误差。因此,系统误差是直接关系到测量结果的准确度。
系统误差产生的原因有以下几个方面。
①测量仪器因素:由仪器本身的缺陷所引起,例如制造技术不过关、刻度不准、仪表未进行校正、安装不正确等。这类误差可以通过检定的方法来校正。
②测量方法因素:例如使用了近似的测量方法或近似的计算公式。
③试剂因素:试剂的纯度不符合要求,或掺杂了其他试剂。
④测量环境因素:如温度、湿度、压力等引起的误差。
⑤操作者因素:因操作者的不良习惯引起,如观察视线偏高或偏低。
改变实验条件可以发现系统误差的存在,针对产生的原因可采取措施将其消除。
(2)随机误差
随机误差又称偶然误差。随机误差是指某次测量结果与相同实验条件下无限多次测量同一物理量所得结果的平均值之差。它是实验者不能预料的变量因素对测量的影响所引起的,它在实验中总是存在,无法完全避免。它产生的原因是不确定的,一般是由于人的感官分辨能力的限制,例如对仪器最小分度以内的估计值,每次读数可能不一样;也可能在实验过程中,虽然仪器、试剂等条件没变,但外部环境条件发生变化,例如大气压、温度的波动。随机误差直接影响到测量的精密度。
随机误差服从概率分布。在相同条件下,对同一物理量多次测量时,会发现测量数据误差符合正态分布,如图Ⅰ-2-1。
图Ⅰ-2-1 随机误差正态分布曲线
由图Ⅰ-2-1可以看出,以为中心的正态分布曲线具有以下特性。
①对称性:绝对值相等的正偏差和负偏差出现的概率几乎相等,正态分布曲线以y轴对称。
②单峰性:绝对值小的偏差出现的机会多,而绝对值大的偏差出现的机会则比较少。
③有界性:在一定测量条件下的有限次测量值中,偏差的绝对值不会超过某一界限。用统计方法分析可以得出,偏差在±1σ(σ为标准偏差)内出现的概率是68.3%,在±2σ内出现的概率是95.5%,在±3σ内出现的概率是99.7%,可见偏差超过±3σ所出现的概率仅为0.3%。因此如果多次重复测量中个别数据的误差绝对值大于3σ,则这个极端值可以舍弃。在一定测量条件下,随机误差的算术平均值将随着测量次数的无限增加而趋向于零。因此,为了减小随机误差的影响,在实际测量中常常对一个量进行多次重复测量,以提高测量的精密度和重现性。
(3)过失误差
过失误差主要是由于实验者粗心大意、操作不当造成的。例如操作失误,读错、记错数据,计算错误等。过失误差值可能很大,且无一定的规律可循。过失误差在实验中是不允许发生的,且有可能完全避免。如发现过失误差,所得数据应予删除。
由于随机误差的存在,实验测定的数据总是有一定的离散性,这是正常的。但是,有时出现个别的偏离较大的可疑数据,又找不到明显的过失误差,对这个可疑数据,要用数理统计的方法判别其真伪,并决定取舍。
判断可疑数据的方法之一是“3σ”准则,当某一可疑数据(xi)与测定的算术平均值()之差大于3倍标准偏差时,则该可疑数据应舍弃,可用公式表示为:
(Ⅰ-2-7)
5.绝对误差与相对误差
绝对误差(δ)是测定值与真值之差,相对误差(d)是绝对误差相对于真值所占的百分数,对于单次测定的数据,它们可以分别以下式表示:
δ=x-x真 (Ⅰ-2-8)
(Ⅰ-2-9)
绝对误差的单位与测定值相同,而相对误差的量纲为1。不同物理量测量的准确度(精密度)可用相对误差(相对偏差)进行比较。绝对误差并不能完全说明测量的准确度。例如:一个500mL量筒的绝对误差为0.5mL,而一个50mL量筒的绝对误差也为0.3mL,显然前者的准确度高于后者,若采用相对误差进行比较,则差异明显。
对于多次测定的数据,绝对误差与相对误差可以分别表示如下。
(1)绝对平均误差(常简称为平均误差)
(Ⅰ-2-10)
测量值平均误差的表示方式为:x真±δ。
而平均偏差的表示方式为:。
(2)相对平均误差
(Ⅰ-2-11)
(3)绝对标准偏差(常简称为标准偏差,又称均方根偏差)在误差分析中,常用标准偏差表征测量结果的分散程度,即表示测量的精密度:
(Ⅰ-2-12)
式(Ⅰ-2-12)中的(n-1),在数理统计中称为自由度,它说明在n次测量中,由于存在一个外加函数关系式(关系式),所以只有(n-1)个独立可变的偏差。
测量值标准偏差的表示方式为:。
(4)相对标准误差
(Ⅰ-2-13)
6.准确度与精密度
(1)准确度
准确度是指测定值与真值之间的一致程度。测量过程中所有误差因素,都会影响准确度。原则上准确度可用误差值的大小表示,正如上面的分析指出,准确度用相对误差来表示更合理,一般采用相对平均误差表示。
(2)精密度
精密度表示测量结果的分散程度,它主要是由随机误差引起的。精密度用偏差值的大小表示,常采用标准偏差表示。
(3)精密度与准确度的区别
精密度与准确度的区别,可用图Ⅰ-2-2形象地表示。
图Ⅰ-2-2 甲、乙、丙三人测量结果示意图
图中:甲表示系统误差和随机误差都很小,精密度和准确度较高;
乙表示系统误差大,随机误差小,精密度高,但准确度较低;
丙表示系统误差小,随机误差大,精密度、准确度都较低。
二、间接测量中的误差传递
在物理化学实验中,最后要得到的结果,大多是间接测量的数据。也就是说,在数据处理阶段,往往是将实验中直接测量的数据代入某种函数关系式进行计算,或通过作图等处理,才能得到最后的结果。在数据处理中,每个直接测量值的准确度都会影响最后结果(间接测量值)的准确性,这种影响称为误差传递。通过对每一步误差传递过程的分析,可以查明各个直接测量值的误差对结果的影响程度,从中可以找出误差的主要来源,可判断所选择的实验方法是否适当,以便于合理配置仪器,寻求测量的有利条件。
1.平均误差和相对平均误差的传递
设某物理量y是从x1、x2、…、xn各直接测量值求得的。即y为x1、x2、…、xn的函数:
y=f(x1,x2,…,xn) (Ⅰ-2-14)
已知测定的x1、x2、…、xn的平均误差为Δx1、Δx2、…、Δxn,若要求出y的平均误差Δy,将式(Ⅰ-2-14)全微分得:
(Ⅰ-2-15)
设各自变量的平均误差Δx1、Δx2、…、Δxn等足够小时,可代替它们的微分dx1、dx2、…、dxn,并考虑到在最不利的情况下,直接测量的正、负误差不能对消而引起误差积累,故取其绝对值,则式(Ⅰ-2-15)可改写为:
(Ⅰ-2-16)
这就是间接测量中计算最终结果的平均误差的普遍公式。
如将式(Ⅰ-2-16)两边取对数,再求微分,然后将dx1、dx2、…、dxn分别换成Δx1、Δx2、…、Δxn,且dy换成Δy,则得:
(Ⅰ-2-17)
上式是间接测量中,计算最终结果的相对平均误差的普遍公式。
例1 以苯为溶剂,用凝固点降低法测定苯的摩尔质量,按下列公式计算:
式中,Kf是凝固点降低常数,其值为5.12℃·kg·mol-1。直接测量m1、m0、t、t0的值,求算苯的摩尔质量。其中溶质的质量是用分析天平称得,m1=(0.2352±0.0002)g,溶剂的质量m0为(25.0±0.1)×0.879g,即用25mL移液管移苯液,其密度为0.879g·cm-3。
若用贝克曼温度计测量凝固点,其精密度为0.002℃,3次测得纯苯的凝固点t0读数分别为:3.569℃、3.570℃、3.571℃。溶液的凝固点t读数分别为:3.130℃、3.128℃、3.121℃。试计算实验测定的苯的摩尔质量M及其相对误差,并说明实验是否存在系统误差。
首先对测得的纯苯凝固点t0数值求平均值:
其绝对平均误差为:
同理求得:
对于Δm0和Δm1的确定,可由仪器的精密度计算:
Δm0=±0.1×0.879=±0.09g
Δm1=±0.0002g
将计算公式取对数,再微分,然后将dm1、dm0、dt、dt0分别换成Δm1、Δm0、Δt、Δt0,可得摩尔质量M的相对误差:
最终结果为:
M=(123±2)g·mol-1,与文献值128.11g·mol-1比较,可认为该实验存在系统误差。
2.标准误差的传递
设函数y=f(x1,x2,…,xn),而x1、x2、…、xn的标准误差分别为、、…、,则y的标准误差为:
(Ⅰ-2-18)
此式是计算最终结果的标准误差的普遍公式。
例2 测量某一电热器功率时,得到电流I=(8.40±0.04)A,电压U=(9.5±0.1)V,求该电热器功率P及其标准误差。
P=IU=8.40A×9.5V=79.8W
其标准误差为:
最终结果为:
P=(79.8±0.9)W
部分常见函数的误差传递公式,见表Ⅰ-2-1。
表Ⅰ-2-1 部分常见函数的误差传递公式
三、有效数字
在测量一个量时,所记录数据的位数应与仪器的精密度相符合,即数据的最后一位数字是仪器最小刻度之内的估计值,其他数字为准确值,这样的数据所包含的数字称为有效数字。即有效数字是测量数据的准确度所达到的数字,它包括测量数据中前面几位可靠的数字和最后一位估计的数字。
例如,普通50mL滴定管,最小刻度为0.1mL,则记录26.55mL是合理的;记录26.5mL和26.556mL都是错误的,因为它们分别缩小和夸大了仪器的精密度。为了方便地表达有效数字位数,一般用科学记数法记录数字,即用一个带小数的个位数乘以10的相当幂次表示。例如0.000567可写为5.67×10-4,表示有效数字为三位;10680可写为1.0680×104,表示有效数字是五位。用以表达小数点位置的零不计入有效数字位数。
在间接测量中,需通过一定的公式将直接测量值进行运算,运算中对有效数字位数的取舍应遵循如下规则。
(1)误差(绝对误差或相对误差)一般只取一位有效数字,最多两位。
(2)有效数字的位数越多,数值的准确度也越大,相对误差越小。例如:(1.35±0.01)m,三位有效数字,相对误差0.7%;(1.3500±0.0001)m,五位有效数字,相对误差0.007%。
(3)任何一次直接测量值,都应读至仪器刻度的最小估读位数。例如:移液管的最小估读位数为0.01mL,则读数的最后一位也要读至0.01mL。
(4)任何一物理量的数据,其有效数字的最后一位,在位数上应与误差的最后一位相一致。例如:用的温度计测量水温为28.65℃,其测量结果的正确表示应是(28.65±0.01)℃;若写作(28.651±0.01)℃,就是夸大了测量结果的准确度;若写作(28.6±0.01)℃,就是缩小了测量结果的准确度。
(5)若第一位的数值等于或大于8,则有效数字的总位数可多算一位。如8.56虽然只有三位,但在运算时,可以看作四位。
(6)确定有效数字的位数时,应注意“0”这个符号,紧接在小数点后面的“0”不算有效数字;而在数值中的“0”应包括在有效数字中,如0.003065,这个数值有四位有效数字。至于30650000,后面的四个“0”就很难说是不是有效数字。这种情况要用指数表示法来表示有效数字。若是四位有效数字,可写为3.065×107;若为五位有效数字,则可写为3.0650×107。
(7)运算中舍弃过多不确定数字时,应用“4舍6入,逢5留双”的法则。例如有下列两个数值:8.675、6.365,要整化为三位有效数字,根据上述法则,整化后的数值为8.68与6.36。
(8)在加减运算中,各数值小数点后所取的位数,以其中小数点后位数最少者为准。
例如:56.38+17.889+21.6=56.4+17.9+21.6=95.9
(9)在乘除运算中,各数保留的有效数字,应以其中有效数字最少者为准。
例如:1.436×0.020568÷85
其中85的有效数字最少,由于首位是8,因此可以看成三位有效数字,其余两个数值也应保留三位,最后结果也只保留三位有效数字。即
(10)在乘方或开方运算中,结果可多保留一位。
(11)对数运算时,对数中的首数不是有效数字,对数中尾数的位数,应与真数的有效数字相同。例如:
[H+]=7.6×10-4,则pH=-lg[H+]=3.12
K=3.4×10-9,则lgK=9.53
同理,对数的尾数有几位有效数字,其反对数的真数也应取相同的有效数字。例如:
0.652=lg4.49;2.5013=lg317.2
(12)算式中,常数π、e及因子和某些取自手册的常数,如阿伏加德罗常数、普朗克常数等,不受上述规则限制,其位数按实际需要取舍。