第三章 实验数据处理
数据是表达实验结果的重要方式之一。因此,要求实验者将测量得到的数据正确地记录下来,加以整理、归纳和处理,并正确表达实验结果所获得的规律。实验数据的表达方法主要有三种:列表法、图解法和数学方程式法。现分别介绍如下。
一、列表法
在物理化学实验中,多数测量至少包括两个变量,在实验数据中,选出自变量和因变量,将两者的对应值列成表格。
数据表简单易作,不需特殊工具,而且由于在表中所列的数据已经过科学整理,有利于分析和阐明某些实验结果的规律性,对实验结果可以进行比较。
使用列表法时应注意以下几点。
①每一个表开头都应写出表的序号及表的名称。
②在表的每一行或每一列应正确写出表头,在表中列出的通常是一些纯数,这些纯数是量的符号A除以其单位的符号[A],即A/[A]。如V/mL;或者是这些纯数的数学函数,如ln(p/MPa)。
③表中的数值应用最简单的形式表示,公共的乘方因子应放在表头注明。
④在每一行中的数字要排列整齐,小数点应对齐。
⑤直接测量得到的数值可与处理的结果并列在一张表中,必要时应在表的下面注明数据的处理方法或数据的来源。
⑥表中所有数值的填写都必须遵守有效数字规则。
表Ⅰ-3-1是CO2的p、V、T测量数据表,其形式可作为一般性参考。
表Ⅰ-3-1 CO2的p、V、T测量数据表
二、图解法
1.图解法在物理化学实验中的应用
用图解法表示实验数据,能直观地显示出所研究的变量的变化规律,如极大值、极小值、转折点、周期性和变化速率等重要特性,并可以从图上简便地找出各变量中间值,还便于数据的分析比较,确定经验方程式中的常数等,其用途极为广泛。
(1)表达变量间的定量依赖关系
以自变量为横坐标,因变量为纵坐标,在坐标纸上标绘出数据点(xi,yi),然后按作图规则(见后文)画出曲线,此曲线便可表示出两变量间的定量关系。在曲线所示的范围内,可求对应于任意自变量数值的因变量数值。
(2)求极值或转折点
函数的极大值、极小值或转折点,在图形上表现得很直观。例如,利用环己烷-乙醇双液系相图,确定最低恒沸点(极小值);凝固点下降法测摩尔质量实验,从步冷曲线上确定凝固点(转折点)。
(3)求外推值
当需要的数据不能或不易直接测定时,在适当的条件下,常用作图外推法求得。所谓外推法,就是根据变量间的函数关系,将实验数据描述的图像延伸至测量范围以外,求得该函数的极限值。例如用黏度法测定高聚物的相对分子质量实验中,只能用外推法求得溶液浓度趋于零时的黏度(即特性黏度)值,才能算出相对分子质量。
必须指出,使用外推法必须满足以下条件:
①外推的那个区间离实际测量的那个区间不能太远;
②在外推的那段范围及其邻近的测量数据间的函数关系是线性关系或可以认为是线性关系;
③外推所得结果与已有的正确经验不能有抵触。
(4)求函数的微商(图解微分法)
作图法不仅能表示出测量数据间的定量函数关系,而且可以从图上求出各点函数的微商,而不必先求出函数关系的解析表示式,称图解微分法。具体做法是在所得曲线上选定若干个点,然后采用几何作图法,作出各切线,计算出切线的斜率,即得该点函数的微商值。
(5)求导数函数的积分值(图解积分法)
设图形中的因变量是自变量的导数函数,则在不知道该导数函数解析表示式的情况下,亦能利用图形求出定积分值,称图解积分。常用此法求曲线下所包含的面积。
(6)求测量数据间函数关系的解析表示式(经验方程式)
如果能找出测量数据间函数关系的解析表示式,则无论是对客观事物的认识深度或是对应用的方便而言,都将远远跨前了一步。通常找寻这种解析表示式的途径也是从作图入手,即对测量结果作图,从图形形式变换成函数,使图形线性化,即得新函数y和新自变量x的线性关系:
y=ax+b (Ⅰ-3-1)
算出此直线的斜率a和截距b后,再换回原来函数和自变量,即得原函数的解析表示式。例如反应速率常数k与活化能E的关系式为指数函数关系:
k=Ae-E/RT (Ⅰ-3-2)
可对两边取对数使其直线化,以lgk对1/T作图,由直线斜率和截距可分别求出活化能E和碰撞频率因子A的数值。
2.作图技术
图解法获得优良结果的关键之一是作图技术,以下介绍作图技术要点。
(1)工具
在处理物理化学实验数据时作图所需工具主要有铅笔、直尺、曲线板、曲线尺和圆规等。
(2)坐标纸
用得最多的是直角坐标纸。半对数坐标纸和对数-对数坐标纸也常用到,前者两轴中有一轴是对数标尺,后者两轴均系对数标尺。将一组测量数据绘图时,究竟使用什么形式的坐标纸,要尝试后才能确定(以能获得线性图形为佳)。
在表达三组分体系相图时,则常用三角坐标纸。
(3)坐标轴
用直角坐标纸作图时,以自变量为横轴,因变量(函数)为纵轴,坐标轴比例尺的选择一般遵循下列原则。
①能表示出全部有效数字,使图上读出的各物理量的精密度与测量时的精密度一致。
②方便易读。例如用坐标轴1cm表示数量1、2或5都是适宜的,表示3或4就不太适宜,而表示6、7、8、9在一般场合下是不妥的。
③在前两个条件满足的前提下,还应考虑充分利用图纸。若无必要,不必把坐标的原点作为变量的零点。曲线若系直线,或近乎直线的曲线,则应被安置在图纸的对角线附近。
比例尺选定后,要画上坐标轴,在轴旁注明该轴变量的名称及单位。在纵轴的左面和横轴的下面每隔一定距离(例如2cm间距)写下该处变量应有的值,以便作图及读数,但不要将实验值写在轴旁。
(4)代表点
代表点是指在坐标中与测得的各数据相对应的点。代表点反映了测得数据的准确度和精密度。若纵轴与横轴上两测量值的精密度相近,可用点圆符号()表示代表点,圆心小点表示测得数据的正确值,圆的半径表示精密度值。若同一图纸上有数组不同的测量值,则各组测量值可各用一种变形的点圆符号(如,×等)来表示代表点。
(5)曲线
在图纸上作好代表点后,按代表点的分布情况,作一曲线,表示代表点的平均变化情况。因此,曲线不需全部通过各点,只要使各代表点均匀地分布在曲线两侧邻近即可,或者更确切地说,是要使所有代表点离开曲线距离的平方和为最小,这就是“最小二乘法”原理。所以,绘制曲线时,若考虑离曲线很远的个别代表点,一般所得曲线都不会是正确的,即使此时其他所有代表点都正好落在曲线上。遇到这种情况,最好将此个别代表点的数据复测,如原测量确属无误,则应严格遵循上述正确原则绘线。
(6)图题及图坐标的标注
每个图应有序号和简明的标题(即图题),有时还应对测试条件等方面作简要说明,这些一般安置在图的下方(如写实验报告也可在图纸的空白地方写上实验名称、图题、姓名及日期等)。
与上述的原理相同,曲线图坐标的标注也应该是一个纯数学关系式。图Ⅰ-3-1是CO2的平衡性质ln(p/MPa)与1/T的关系,其标注可作为参考。
图Ⅰ-3-1 CO2的平衡性质
ln(p/MPa)与1/T的关系图
应注意栏头或图坐标标注的正确书写。例如,将栏头或标注“T/K”错误地写成“T,K”或“T(K)”;将“ln(p/MPa)”错误地写成“lnp,MPa”或“lnp(MPa)”。写成“T,K”或“T(K)”在概念上是含糊的。而写成“lnp,MPa”或“lnp(MPa)”在概念上是错误的,因为对数的真数是一个纯数,不能是一个物理量。但为了简便,一般的教科书中在公式中往往将ln(A/[A])简写为lnA,本书以后也作这样处理,请读者注意。
三、实验数据方程的拟合
人们常会需要寻求一个最佳方程以拟合实验获得的数据。这里存在着两个方面的问题,其一是要选择一适当的函数关系;其二,要确定函数关系中各参数的最佳值。在许多场合,其函数关系事先就已知道。例如,在研究液体的蒸气压与温度的关系时,就有已知的克劳修斯-克拉贝龙(Clausius-Clapeyron)方程可予以应用。
如果一时还不了解数据内在的函数关系,第一步通常是根据数据作图,其方法如前所述,此时须注意讨论对象所附带的条件。例如热力学温度没有负值等。只要画出了平滑的曲线,根据实验者的经验和判断,常常就能大体猜出某一合适的函数关系式。有些特殊的偏差究竟是由于函数关系不当,还是由于数据呈无规则分布而造成的,通常还必须运用常识来判断。如果数据非常分散,试图拟合一个方程是毫无意义的。一般来说,平滑曲线上的极大值、极小值和拐点的数目越多,所需要的参数变量也就越多,曲线拟合的工作就越复杂。
把数据拟合成直线方程要比拟合成其他函数关系来得简单和容易。因此根据数据作图时,都希望能找到一个线性函数式。通常只要看看数据的曲线图形,往往就可提出适当的函数式来做尝试。某些比较重要的函数方程关系式及其线性式列于表Ⅰ-3-2。表中后两栏为直线的斜率和截距,内含非线性方程中的常数。但是,并非所有的函数都可化成线性形式。例如
y=a(1-ebx)
表Ⅰ-3-2 常见函数方程关系式及其线性式
这一重要关系式就没有线性式。对于这种情况,就需要采用其他一些专门的方法。
如果做了尝试以后,某种函数可以把有关数据转化为线性关系,则可认为这就是合适的函数关系式,由直线的斜率和截距可计算出方程中的常数。一个方程可能会有多种线性形式,如果由不同的线性式算得的常数值相差悬殊,我们必须判断哪一个数值可能是最合适的。由某些线性式求得若干常数值后,就可根据所求的常数值写出原先的非线性方程式,并验证它与实验数据是否符合。
确定一直线的常数值通常有两种方法:平均法及最小二乘法。
1.平均法
用有关数据确定两个平均点,经过这两点得一直线。为了得到这两个平均点,先把数据按x(或y)的大小顺序排列,把它们分成相等的两组。一组包括前一半数据点,另一组为余下的后一半数据点。如果数据点为奇数,中间的一点可以任意归入一组,或者分别归入两个组。这之后,再对每一组数据点的x轴坐标和y轴坐标分别求平均值。这样便确定了两个平均点,即(x1,y1)和(x2,y2)。
可以直接通过这两点画出直线,也可以用代数方法解两个联立方程y1=ax1+b和y2=ax2+b(第二个方法就是把数据组合成两个联立方程,其公式为∑y=a∑x+nb)。更好的代数方法是计算线性方程的斜率,即
把这个斜率及一个平均点的数值代入方程
y=ax+b
便可解出b。
2.最小二乘法
最小二乘法的基本假设是残差的平方和为最小,即所有数据点与计算得到的直线之间偏差的平方和为最小。通常,为了数学上处理方便,假定误差只出现在因变量y,且假定所有数据点都同样可靠。
对于第i个点,残差为:
δi=yi-axi-b (Ⅰ-3-3)
式中,xi、yi代表测量值。残差的平方和为:
(Ⅰ-3-4)
此和是每个测量数据点与两个参数a、b的函数。不同的a、b值可定出一系列的直线,而a、b的数值则由数据点决定。残差的平方和随不同的直线,即不同的a、b值而变化。为了选择适当的a、b值,使其残差的平方和为最小值。可将方程(Ⅰ-3-4)对a和b求导,令导数为零并解出这两个方程。若有n个数据点,则斜率和截距的表达式为:
(Ⅰ-3-5)
(Ⅰ-3-6)
四、Origin软件及其在实验数据处理中的应用
Origin是美国Microcal公司推出的数据分析和绘图软件。Origin功能强大,在各国科技工作者中普遍应用。
Origin的主要功能是数据分析和绘图。Origin的数据分析功能都是通过相应菜单命令实现的,包括数据的排序、调整、计算、统计、曲线拟合等。Origin的绘图是基于模板的,选择好所需要绘图的数据后,点击工具栏上相应按钮就可以实现快速绘图。目前Origin软件能提供几十种二维和三维绘图模板供使用。
Origin有不同于其他软件和语言的特点,最突出的特点是使用简单,它采用直观的、图形化的、面向对象的窗口菜单和工具栏操作,全面支持鼠标右键操作、支持拖放式绘图等,且其典型应用不需要编写任何一行程序代码。Origin提供了直观、简单的数学分析和绘图环境。
物理化学实验涉及较多的物理检测仪器,实验结果涉及较复杂的数学模型和数值换算,而且一般需要使用各种科学图形来解释和分析实验结果。物理化学实验中常见的数据处理有:①公式计算;②用实验数据作图或对实验数据计算后作图;③线性拟合,求截距或斜率;④非线性曲线拟合;⑤作切线,求截距或斜率。
以前学生多用坐标纸手工作图,手工拟合直线,求斜率或截距;手工作曲线和切线,求斜率或截距。这种手工作图的方法不仅费时费力,而且误差较大。本来实验数据就有一定的误差,加上数据处理带来的较大误差,所得结果的误差就更大。
利用Origin软件可方便地进行作图、线性拟合、非线性曲线拟合等数据处理,能够满足物化实验数据处理的要求。下面简单介绍用Origin软件对物理化学实验数据处理的方法。
1.Origin软件的一般用法
(1)数据作图
Origin可绘制散点图、点线图、柱形图、条形图或饼图以及双Y轴图形等,在物理化学实验中通常使用散点图或点线图。
其基本步骤如下。
①启动Origin程序,菜单栏View/Toolbars菜单中至少选中2D graphs和Tools,显示必需的按钮,在数据窗口输入需作图数据,左边为X轴,右边为Y轴。
②拖动鼠标选定需作图数据,点击按钮,弹出图表窗口,得到连线图。
③点击按钮,在图表上可划出横线、竖线和斜线,可用鼠标选中再移动线的位置。
④点击按钮,再将鼠标点击图表指定位置,将显示该点的坐标。
⑤点击按钮,再将鼠标点击图表指定位置,可在该处添加文本,并可选择字体、字号等。
⑥数据处理完毕,点击(save project),将处理结果命名保存。
⑦点击菜单栏Edit中copy page命令,可将图表复制到Word文档,并可放大或缩小。
⑧千万注意:关闭Origin程序时应关主程序,此时数据和图表不丢失;如点击数据或图表子窗口的按钮,则会将该子窗口删除。
(2)线性拟合
当绘出散点图或点线图后,选择Analysis菜单中的Fit Linear或Tools菜单中的Linear Fit,即可对图形进行线性拟合。结果记录(view/results log)中显示拟合直线的公式、斜率和截距的值及其误差、相关系数和标准偏差等数据。在线性拟合时,可屏蔽某些偏差较大的数据点,以降低拟合直线的偏差。
(3)非线性曲线拟合
①Origin提供了多种非线性曲线拟合方式。
a.在Analysis菜单中提供了如下拟合函数:多项式拟合、指数衰减拟合、指数增长拟合、S形拟合、Gaussian拟合、Lorentzian拟合和多峰拟合,在Tools菜单中提供了多项式拟合和S形拟合。
b.在Analysis菜单中的Non-linear Curve Fit选项提供了许多拟合函数的公式和图形。
c.Analysis菜单中的Non-linear Curve Fit选项可让用户自定义函数。
②在处理实验数据时,可根据数据图形的形状和趋势选择合适的函数和参数,以达到最佳拟合效果。多项式拟合适用于多种曲线,且方便易行,操作如下。
a.对数据作散点图或点线图。
b.选择Analysis菜单中的Fit Polynomial或Tools菜单中的Polynomial Fit,打开多项式拟合对话框,设定多项式的级数、拟合曲线的点数、拟合曲线中X的范围。
c.点击OK或Fit即可完成多项式拟合。结果记录(view/results log)中显示:拟合的多项式公式、参数的值及其误差,R2(相关系数的平方)、SD(标准偏差)、N(曲线数据的点数)、P值(R2=0的概率)等。
2.Origin软件在物理化学实验数据处理中的应用
现以液体的饱和蒸气压的数据处理为例。
液体的饱和蒸气压与温度的关系可用克拉贝龙(Clapeyron)方程式来表示,设蒸气为理想气体,在实验温度范围内摩尔汽化热ΔvapHm为常数,并略去液体的体积。将其积分得克劳修斯-克拉贝龙(Clausius-Clapeyron)方程,图Ⅰ-3-2为实验测得各温度下的饱和蒸气压后,以ln(p/kPa)对1/T所作的图,ln(p/kPa)对1/T作图得一条直线。根据直线得斜率m,进一步可求得实验温度范围内液体的平均摩尔汽化热ΔvapHm。
图Ⅰ-3-2 饱和蒸气压的ln(p/kPa)与1/T关系图
利用Origin软件强大的数据处理功能以及便捷的图表生成功能,对纯液体饱和蒸气压的数据进行处理,将表格中枯燥的数据迅速便捷地生成各种直观生动的图表。同时生成p-T和lnp-1/T的对应关系方程,并对所测数据进行分散程度的综合评估,以此来说明实验数据的可靠性。
实际操作过程:将实验数据(T,p)输入Origin的工作表;在工作表中选定数据,点击散点图,改写X轴、Y轴的名称,得到以T为横坐标、p为纵坐标的散点图;点击Tools菜单Polynomial Fit项,点击Fit键即进行多项式拟合,拟合结果包括拟合曲线(图)和拟合参数(保存于结果窗口中),本实验为二项式拟合,因此得到Y=A+B1X+B2X2模型,相应会得到A、B1、B2的值和拟合曲线与数据点的R(相关系数)和SD(标准偏差)。
由p-T曲线上任意读取10个点,填入Origin的工作表A、B列,然后新增加C列,选定C列,将该列数值设为col(C)=1/col(A),新增D列,将该列值设为col(D)=ln(col(B)),执行相应的数据换算。
选定C、D列,作点击散点图,改写X轴和Y轴的名称,然后点击Tools菜单Linear Fit项,点Fit键后进行线性拟合,拟合函数为Y=A+B1X,从直线斜率算出液体的平均摩尔汽化热。求得液体的正常沸点并与文献值比较。可计算相对误差。
最后的工作是把相关实验参数与结果标记在图形上,复制图形粘贴到Word文档中或进行打印,进一步完成实验报告。
如果使用手工作图,同一组数据由不同的操作者处理时,得到的结果很可能是不同的;即使同一个操作者在不同时间处理,结果也不会完全一致。而Origin软件能够准确、快速、方便地处理物理化学实验的数据,能够满足物理化学实验对数据处理的精度要求,用Origin软件处理物理化学实验数据,只要方法选择适当,得到的结果较为准确。
参考文献
[1] Salzberg H W,Morrow J I,Cohen S R,Green M E.Physical Chemistry Laboratory:Principles and Experiments.New York:McMillan,1978.
[2] Shoemaker D P,Garland C W,Nibler J W.Experiments in Physical Chemistry.New York:McGraw-Hill Book Company,1989.
[3] 宋清.定量分析中的误差和数据评价.北京:高等教育出版社,1984.
[4] 复旦大学等编.物理化学实验.第3版.北京:高等教育出版社,2004.
[5] 傅献彩,沈文霞,姚天扬等编.物理化学.第5版.北京:高等教育出版社,2005.
[6] 华南师范大学化学实验教学中心组织编写.物理化学实验.北京:化学工业出版社,2008.
[7] 唐林,孟阿兰,刘红天编.物理化学实验.北京:化学工业出版社,2008.