03 光波 Waves
在第2章里,光被认为是由基本粒子组成的,并沿着明确的轨迹运动,我称之为“台球”模型。在这一模型中,光束可看作是由一个个分布紧凑的能量束集合而成的,这与光是波的观点形成鲜明的对比。事实上,光的波动说与光的粒子说的发展可谓并驾齐驱,只不过与光的粒子说相比,光的波动说经过了很多年的争论和实验之后,才被人们完全接受。
无法解释的现象?
在阳光下观察水面上漂浮的一小层薄油,你会在油层的边缘发现彩色的轮廓。正是这一观察激发了一个跨时代的想法——光是作为波运动的。牛顿是最早描述这种现象的人之一,但是这一现象对他的光粒子模型提出了挑战。为解释这一现象,牛顿势必要对他的模型进行严重的扭曲。而在海峡对岸,牛顿在光学上的竞争对手、法国科学院院长、荷兰人克里斯蒂安·惠更斯(Christian Huygens)则使用了光的波动模型来解释这一现象。这一解释被证明更加合理。因此,早在光学研究初期,波和粒子的概念就已经同时出现了。
不仅是这一种现象,还有其他的现象也不能够用光的粒子说来解释。例如17世纪中期弗朗西斯科·格里马尔迪(Francesco Grimaldi)的一些发现。他发现光线通过小孔(比如屏幕上的一个小孔)时会偏离直线。他注意到光线发散开来,且在光束的边缘看到了彩色的条纹,这种现象对于头发或者薄纱这种小物体尤为明显。他总结说,光照射在一个小或窄的物体上所形成的条纹说明,当光经过这些物体边缘的时候偏离了其原始路径。如果光真的是由沿着直线运动的粒子组成的,那么这样的固体物质肯定会投射出阴影,而不会导致光粒子偏离成奇怪的模式。
此外,令牛顿和他同时代的人都感到困惑的一个问题是,当光通过某些物体,尤其是一些晶体,例如方解石(一种自然矿物)时,会发生古怪的折射,这个现象用光的粒子说根本解释不清楚。图15中的例子就很好地体现了这个现象。用灯泡照亮一张纸上的单词“LIGHT”,且用两块方解石分别盖住单词的左右各一半。在图15a的左半边图像中,单词由一个错位成了两个,右半边图像中的单词也变成了两个,且错位的方向相反。将图中15a左半边上方的图像和右半边下方的图像结合起来,才是符合人们期望的、由纸反射的光经过晶体折射后看到的单词。而图15b似乎是由不同的折射率产生的。如图15b、15c图所示,通过在晶体上放置偏振器,可以分离由两个不同方向偏振光形成的图像。每个偏振光都有不同的折射率,这就是双折射现象。
图15 展示双折射现象的一个实验。在入射光分别为非偏振光(a)、垂直偏振光(b)、水平偏振光时(c),透过一对方解石晶体观察写在纸上的单词LIGHT
所有的这些观测结果都表明光还有一些性质无法解释。这些性质分别是干涉、衍射与偏振。我们将在本章对这些现象进行探索,继续讲述光的波动说。
波长和频率
波的特点是什么?波是与介质有关的一种波动形式,例如池塘表面的水波,这些波是由水分子在水与空气界面处的上下运动形成的。这种运动的最高点和最低点即为水波的波峰和波谷,而水波本身沿着池水表面运动,也就是说水波的运动方向与水分子的运动方向垂直。因此,它被称为横波。它的波速取决于水的深度等因素。
图16 水面上的圆形波:a.等高线,也称为波前;b.在某特定时刻,波的高度与距中心位置距离间的关系图;c.在水面某特定位置,波的高度和时间之间的关系图
如图16a所示,一块石头被抛入水中,圆形的表面波从石头入水处产生,并往外扩散,这是一种很常见的现象。相邻波峰之间的距离称为波长(见图16b),波峰到达岸边的速率称为波的频率(见图16c),波长和频率的乘积称为波速。
很多个世纪以来,人们一直有个疑问,光究竟是由哪种波组成的?一些人认为波的存在需要某种介质。由于光的速度很大,所以这个介质必须非常坚硬,但是这样又会导致其他物体很难穿过它。比方说,我们之所以能够看到遥远的恒星,肯定是存在某种介质使得光得以在恒星和地球之间传播。地球在围绕太阳运转的过程中必然会不断地穿入并穿出这种介质。这种神秘的介质被称为“以太”,直到19世纪末,它才被视为一个无用的概念而被抛弃。
所以,光是什么样的波呢?这个问题最终由詹姆斯·克拉克·麦克斯韦在19世纪给出了答案。他指出这是一种新的实体的振动:电磁场。电磁场是作用在电荷和磁性材料上的力。例如,一块带有静电的布会吸附灰尘颗粒,一块磁铁会被吸附到冰箱门上。在第二个例子中,当你手拿着磁铁靠近冰箱门时,你的手就能感受到这种力:磁铁会加速靠近冰箱门,除非你给磁铁施加一个反向的作用力。
在上面两个例子中,都存在一种力将一个物体拉向另一个物体。在第一个例子中,布上的电荷产生电场,因而在离布一定距离之内的灰尘将受到源自该电场的力。同样,冰箱门受到的作用力源自磁铁产生的磁场。19世纪早期,迈克尔·法拉第就已经证明了电场和磁场之间存在紧密的联系。麦克斯韦把电场和磁场合在一起,称为电磁场。在波动模型中,光可以看作电磁场的高频振荡。基于这个观点,移动的电荷可以产生光波。我将在第5章中讨论这种方法以及其他产生光的方法。
干涉
如果将两块石头扔到水里相距较近的位置,那么从这两个位置就会产生两组圆形波,它们向外扩散并最终相遇。在波与波叠加的地方,波峰会变得更高。在水面上也有另外一些可以连接成线的地方,尽管两个波都经过,却没有丝毫高低起伏。这些线的位置如图17所示,一般都是沿着波前(波源发出的振动经相同时间所到达的各个波峰点组成的面,见图17a中灰色的同心圆线,圆心则为波源位置)。
图17 a.水面上两个圆形波相互干涉,灰色的线是等相位线;b.两个波的波程相同,彼此之间发生相长干涉;c.两个波的波程相差半个波长,彼此之间发生相消干涉
这种现象被称为干涉,它是由两个波相遇时的振幅相加而产生的。如果两个波的峰值重合,则波峰的振幅变为原来的两倍。也就是说两个同相位的波,会发生相长干涉,即波的振幅加倍,见图17b。如果两个波是反相位的,也就是说其中一个波的波峰和另外一个波的波谷相遇,则合成波的振幅为零,使得这两个波彼此抵消,被称为相消干涉,见图17c。很显然,这样的现象不可能发生在粒子上,因为两个粒子是不可能互相抵消的。
1803年,托马斯·杨在一个著名实验中观察到了干涉现象,这一发现使得光的波动说成为解释光本质的主要理论。杨的实验简单而精妙。他用一个蜡烛当光源,蜡烛后面放一块屏幕,在屏幕上有两个距离很近的小孔。光线透过这两个小孔,投射在被放置在不远处的第二块屏幕上。如果只使用一个小孔(例如盖住另一个小孔),那么在第二块屏幕上就会出现一个小小的光斑。然而,在两个小孔都开放的情况下,奇妙的现象发生了:第二块屏幕上出现的并不是一个两倍于之前亮度的光斑,而是在此基础上出现了条纹。这些条纹由亮度几乎为零的直线组成,方向垂直于两个小孔的中心连线。图18是光线穿过两个小孔之后产生干涉现象的横截面图。这种条纹被称为“杨氏条纹”,是光作为波运动的关键证据之一。
我们之前提到牛顿做过的一个实验,光在两个靠得非常近的平面上反射时会产生彩色条纹。那么如何利用干涉原理来解释牛顿观察到的彩色条纹呢?我们知道,产生干涉现象需要两个波,其相对相位(两个波峰值的相对位置)可以调整。在牛顿的实验中,一束入射光被两个平面反射,从而被分成了两个波,就是在这两个波之间发生了干涉。如果两个反射面的距离等于光的波长,那么两个波的波峰相互重合,会形成一道亮条纹;如果两个反射面的距离等于半个波长,那么一个波的波峰和另一个波的波谷重合,从而发生相消干涉,产生“暗条纹”。因此,当你观察明暗条纹时,你会发现明暗条纹之间的间隔小于一个波长。对于波长约为500纳米的绿光,这一间隔甚至可以小于250纳米——约为头发丝直径的1/40。
图18 托马斯·杨的实验。光透过一个小缝之后形成一个光滑的光强分布图。光透过两个小缝之后,形成一系列明暗条纹,这是典型的波动特征
当然,对于不同的波长,明暗条纹会出现在不同的地方。由于白光是由各种波长不同的光组成的,所以如果入射到平面上的光是白光,那么出现的条纹就会是彩色的。水面上油层边缘出现的彩色轮廓就是由于光波的干涉产生的。
干涉可以将微小的距离(与光的波长在同一个量级)转化为非常明显的光强度变化:最暗的地方光强度可以为零,而最亮的地方,其亮度可以达到单束光强度的4倍。这种光强度的变化很容易被探测或观察到。因此,在测量光波长这一量级的位移尺度时,干涉是一个很好的测量方法。很多光学传感器都是基于干涉效应的。
全息技术
干涉还可以用来制作真实的三维图像,它可以从任意角度观察图像,显示观察对象不同角度的图像。这种图像被称为全息图,与3D电影中所谓的合成图像不一样。全息图是通过记录物体散射出的光的完整波形制作而成的。我们平常拍摄的二维图像只编码了波的强度,而波的相位信息却丢失了。这是因为拍摄二维图像所使用的传感器只对波的强度做出响应,所以我们无法从这些图像中提取出相位信息。然而,要想对物体的形状进行编码,就需要利用相位信息。
干涉可以将相位信息编码为强度信息,这样光电探测器就可以记录目标波完整的振幅和相位信息,原理如图19所示。物体散射的光波与一束参考波发生干涉,其中参考波是由激光产生的已知形状的波。干涉图案则由传感器或者感光材料记录下来。这就是丹尼斯·加伯(Denis Gabor)于20世纪中期发明的全息技术。
与普通照片相比,观看全息图要复杂一些。首先,用一束参考波照亮全息图,其中一些光从全息图的编码图案中散射出来。这些散射光束有一个显著特性,它们再现了从原始物体散射出来的光束,因此当你的眼睛接收到这些散射光时,看起来就好像原始物体在你面前被重建了。在全息图周围移动时可以看到物体的不同侧面,因为这些从不同部分散射的光束编码了不同的信息。
图19 全息图是通过记录一束参考波和物体的散射光波之间的干涉条纹而形成的
全息图也可以由电脑制作并压印在金属或其他材料上。材料表面的起伏模仿了参考波与物体散射波的干涉图样:凸起的部分代表了亮条纹,凹进去的部分代表了暗条纹。同理,想观看这样的全息图也要用一个参考波照射,使得其材料上散射的光再现原物体发出的散射波前。这种全息图还被用来作为安全装置,包括在钞票上的使用[1],因为它太难制作了,要借助很先进的工程技术才可以。
再次探讨成像极限
光的波动说还解释了为什么我们无法用显微镜观察极其微小的物体,正如阿贝所注意到的一样。小到半个微米(一米的百万分之一或可见光波长的一半)的微小物体可以用一般的光学显微镜观察,而对于再小一些的物体,我们就需要用更加复杂的方法进行观察,这是因为光的波动特性限制了光斑的最小尺寸。
我之前提到过,两束光相遇会发生干涉从而产生暗条纹,也就是强度为零的区域。这些条纹的间距取决于两束光相交时的角度。如果角度很大,则条纹间距较小;反之,如果角度较小,则条纹间距较大。条纹的最小可能间距为一个波长;对于可见光而言,这个间距大约是一个微米。
如果这个干涉条纹图样被记录为全息图,那么当它再次被参考光束照亮时将会产生两束光,其方向与用来记录干涉条纹的光束方向一致。如果想用显微镜观察到这种条纹图,使用的透镜必须将这两束光都捕捉到才能形成干涉条纹,如果透镜只能捕捉到其中一束光,那么观察到的图像中就不会出现干涉条纹了。
这是我在第2章中介绍的阿贝准则的物理基础:成像系统的透镜捕捉到的两个光束之间的最大角度决定了所能观察到的物体的最小尺寸。很容易看出,透镜系统所能观察到的物体的最小尺寸大约等于穿过透镜的入射光的波长。因此传统的光学显微镜能够观察到的最小物体尺寸约为人的头发丝直径的1/50,比这再小的尺寸就观察不到了。例如,光学显微镜可以用来观察生物细胞,但不能用来观察细胞核。
超分辨率成像
光学科学家和工程师们想出了很多巧妙的方法,以突破传统光学显微镜对观察目标尺寸的限制,这样他们就可以看到细胞内部,或者可以观察到尺寸不到光的波长百分之一的物体。这些仪器使用了新材料和新工艺,比如把纳米级粒子附着到观测目标上,或者将会发光的分子插入细胞中。当它们被一束短波长的光照射时,可以发出长波的光(如荧光)。由于它们的尺寸比显微透镜的分辨率小得多,根据阿贝公式,最终得到的图像会是一个尺寸受限于显微镜光学的斑点。但是我们可以用摄像机长时间观察附着在物体表面的纳米颗粒发出的荧光,并且确定光斑强度最强的位置,从而精确定位图像的中心点。这个技术被称为“光激活定位显微镜”(photo-activated localization microscopy,缩写为PALM),由美国的埃里克·白兹格(Eric Betzig)发明。这个发明彻底改革了活细胞成像技术,使得人们可以在宽视野范围内更快地采集信息并获取更精确的深度分辨率。
在较大尺寸的荧光物体中测量微小结构的另一个方法是,先用一束光照射物体使其产生荧光,然后用第二束圆形光照射物体,使得光斑外围的荧光消失,只有中心的荧光点保持不灭。通过这样的方法,可以利用保留下来的尺寸很小的荧光点对物体进行精确定位,精确定位的方法跟我们之前描述的定位方法一样。这种方法叫做“受激发射损耗显微技术”(Stimulated Emission Depletion Microscopy,缩写为STED),是由德国的斯特凡·赫尔(Stefan Hell)发明的。在第5章我会对受激发射的过程进行详细描述。这些高分辨率成像的新技术使得科学家们得以观察细胞内部的结构,从而在生物学和医学领域中产生了巨大的影响。这种影响的重要性已经获得了认可——白兹格和赫尔获得2014年的诺贝尔化学奖。
阿贝准则反过来使用也是成立的:当光通过显微透镜照射在观测样本上时,聚焦形成的光斑直径不可能小于一个波长。而且聚焦的紧密度,也就是光斑的大小,取决于透镜和透镜照射面之间的夹角范围:角度范围越大,光束聚焦得越紧密。
干涉光束的角度范围和明暗条纹尺寸之间的关系是波的一个基本特性。19世纪初期法国科学家约瑟夫·傅里叶(Joseph Fourier)对这一观点进行了量化,对光波的传播进行了详细的数学分析。傅里叶定理简单来说就是:要想使光线聚焦的光斑尺寸越小,那么就得保证传播到这个光斑的入射光角度范围越广。
衍射
这解释了光的另外一个特征,即光在传播过程中会逐渐发散。这是因为根据定义,一束光的空间范围是有限的,它必须由一道道沿着不止一个方向传播的波组成。我们可以用激光笔来验证上述想法。激光笔发射出的光束直径大约是10微米,当它照射在屏幕上时,直径大约为1毫米。如果激光照射的距离更远,例如照射到月球上去(大约40万千米),那么光斑直径会高达24千米。这种现象就是衍射。
衍射在测定结构的形状和对称性方面有一些有趣的应用。例如,一束光照射在有小孔的屏幕上,当小孔的直径和波长相近时,光线会通过小孔发生衍射,且其光束的扩散程度与孔径的尺寸成反比。这些衍射光束在距离屏幕一段距离的地方会相互发生干涉,形成干涉条纹,也就是所谓的衍射图案,它反映了小孔的大小及相对位置。例如,如果小孔按照规律进行排列,那么经过该小孔产生的衍射图案就会显示出相应的规律性。使用衍射图案对物体进行测量的优势在于不需要非常昂贵或者复杂的透镜系统,也不需要让探测器非常靠近物体,只需要观察因为衍射而自然扩大的图案。
现在,我们假设屏幕被一个透明的固体材料所替代,比如说晶体蛋白结构。“小孔”则被蛋白质分子中的原子所替代。这些原子非常小,并且通过分子中的键相互连接,这些键的长度约为十亿分之一米(0.1纳米)。如果波长接近于这个尺寸的光照射在这种结构上,光就会发生衍射,分子本身的实际结构就可以由衍射图样确定出来,这是X射线衍射的基础。正如第1章中提到的,它曾因探索DNA的结构而闻名,现在也是生物化学领域很常见的工具,常常被用来探寻新分子(例如可能有助于开发药物的新分子)的结构。这一过程需要一束明亮的X射线源,以及将分子晶体化的方法。图20是牛肠道病毒[2]晶体的衍射图。
图20 使用现代同步辐射X射线源拍摄到的蛋白质晶体的X射线衍射图
很明显,如果你想远距离传输光,那么衍射可能会是一个问题。衍射会使得光束的能量分散开来,因此,随着传输距离的增加,你需要的光学系统和传感器要越来越大才能够接收所有的能量。这对电信业来说非常重要,因为几乎所有通过远程通信传输的信息都被编码在光束里。
导波
为使远距离通信成为可能,就要对衍射进行管控,解决这一问题的方法就是使用波导,例如光纤。波导是一种经过精心设计的截面具有特殊折射率的结构。例如,光纤内的折射率变化分布经过了特殊设计,使得直径为几百万分之一米的“芯”比周围“包层”的折射率更高。这样,光就被局限在折射率较高的“芯”里(成为导波),沿着光纤移动而不发生衍射,从而完成远距离传输(例如通过海底光缆横跨大西洋),同时光束的大小保持不变。从通信到传感器等许多光信息基础设施,都是依靠这种控制光的方式来工作的。
偏振
光的波动模型的最后一个重要特征是偏振特性。回想一下,在横波中,波的振动方向与波的传播方向相垂直。但是,与波的传播方向成直角的方向有两个,也就是说,横波有两个可能的波动方向。
以一根绳子上产生的波为例。如果你将绳子的一端上下快速移动,你会发现波是沿着绳子移动的。如果快速地左右移动绳子一端,也会发生类似的事情。不管是垂直于地面振动,还是水平于地面振动,这两种振动方向都与绳子的方向垂直,也就是与波的移动方向垂直。这样的波都被称为“横波”。
光波就是一种横波。水平偏振光有一个在水平面(相对于光具座[3])上振荡的电场。类似地,垂直偏振的光束在垂直平面上振荡——还有其他更加复杂的偏振形式,这里就不赘述了。要解释双折射现象,我们可以先从晶体的结构入手。晶体由单位晶胞重复排列组合而成。作为构成晶体的最小几何单元,晶胞是由原子构成的特殊结构。这些晶胞本身可能是不对称的,光沿着晶胞的长轴或短轴传播时会发生不同的偏振,折射率也将随之不同。因此,当光通过这种晶体的时候,光的传播方向会发生不同程度的偏移。
众所周知,太阳眼镜就是利用了光的偏振特性。一些太阳眼镜使用塑料(例如塑料偏光薄片)做镜片来充当偏振片。偏振片只允许某个特定偏振方向(例如垂直偏振)的光通过,垂直于该特定方向的偏振光(例如水平偏振)则被偏振片所吸收。塑料偏光薄片是由橄榄球形状的分子组成的,这些分子在这种塑料聚合物中整齐排列并且像被“冻住”一样一动不动。这些分子优先吸收沿着分子排列轴方向偏振的光。一般来说,由于由物体散射的阳光会随机偏振(约为每个偏振方向的50%),因此,过滤掉某一偏振方向的光就可以有效地将场景亮度降低一半。此外,太阳镜还可以减少眩光,即从光亮的平面(例如汽车的引擎盖或者风挡玻璃)反射的光线。这些平面倾向反射偏振方向与该平面平行的光[4]。戴上我们上面所说的太阳镜之后,这种反射光就因为其偏振方向被太阳镜挡住,因此看马路的时候视野会更加清晰。
透明双折射材料也可以在不吸收光的情况下改变光的偏振。这是因为光的传播速度取决于相对于材料“方向”的光的偏振方向。一些材料,例如一般的玻璃,是没有特定方向的:你可以任意旋转它而不改变其对光束的影响。但如前文所述,双折射材料中原子的排列有一个优先方向,即对称轴的方向。沿着这个方向,原子对光的响应是不同的。也就是说,沿着对称轴偏振的光的传播速度比垂直于对称轴偏振的光更慢。想象一下,光的偏振方向与对称轴的夹角为45°时,假设有一半的光沿着对称轴方向偏振,另一半则垂直于对称轴方向偏振。如果后者的速度减慢得足够多,穿过材料之后透出来的光,将会沿-45°的方向偏振,相当于光的偏振方向被“旋转”了90°。
一些双折射材料可以通过主动调整分子排列轴的方向来控制偏振状态,例如对材料本身施加电压。一个典型的例子就是液晶(Liquid Crystals,缩写为LCs),它由细长的分子组成,液晶中分子的方向可以通过施加电压的方式来控制。此外,通过施加压力或者应力,其他的一些材料也可以变成双折射材料,这是因为外力使得材料内部的分子发生“转动”或者让原子的排列方向发生了改变。利用这个现象可以构造力学传感器,通过观察光传感器端输出的光的偏振状态来对力进行监测。
在两个偏振片之间放置一个双折射液晶,就可以通过电对光的强度进行控制。施加电压可以使分子重新定向,从而改变偏振光束在这一材料中的折射率。如果在液晶之后放置一个偏振片,那么根据施加的电压的高低可以控制通过偏振片光强的高低。将这样的“单元”构成阵列,且每一个单元由独立的电信号驱动,这样就构成了一个显示屏,每一个单元就是一个像素。这就是液晶显示器(Liquid Crystal Display,缩写为LCD)的基础,这一技术通常用于电脑显示屏或者电视机。
事实上,这种显示屏还可以用来播放3D电影。在这样的电影中,我们感知到的深度其实是一种错觉,来自人类视觉的立体感。由于我们的两只眼睛间有几个厘米的距离,所以两只眼睛观看同一个场景时感知的方位略有不同。这两幅图像在大脑中结合,让我们感知到深度。
这种错觉可以通过3D眼镜的偏振作用再现出来。两幅图片被同时投影在显示器或屏幕上,每一幅都是由特定偏振的光产生的,而且是从略微不同的角度进行拍摄的。3D眼镜由偏振方向不同的两个偏振片组成,使得左眼可以看到其中一幅图,右眼可以看到另外一幅。因为两幅图片发出的光都分别只与其中一个偏振片允许通过的方向一致,因此每只眼睛只能看到一幅图片,于是我们看到的场景就跟我们在自然界看到的景象一样,即物体和人看起来都是三维的。
光的波动模型的成功令人振奋,这让我们得以了解光的一些重要特性,从而利用这些认识来构建新的技术。光的粒子说同样令人惊叹。然而,这两种截然不同的关于光的本质的学说都是必要的,这确实令人十分困惑。我现在就要转向这个难题。
[1] 例如20英镑的纸钞上就印有18世纪苏格兰经济学家亚当·斯密(Adam Smith)的全息图。
[2] 一种小RNA病毒,下图为其衣壳蛋白结构。
[3] 一种多功能的通用光学仪器。
[4] 这个现象于19世纪被大卫·布鲁斯特(David Brewster)爵士发现,并以他的名字命名。