2 空间、时间和量子的困境
第2章 空间、时间和观众的眼睛
1905年6月,26岁的阿尔伯特·爱因斯坦向德国《物理学纪事》投去一篇论文,解决了在少年时代就令他困惑的一个关于光的疑问。杂志的编辑普朗克(Max Planck)在翻过爱因斯坦的最后一页手稿后,意识到大家接受的科学秩序荡然无存了。那位来自瑞士伯尔尼专利局的小职员,已经不声不响地把传统的空间和时间概念彻底推翻了,取而代之的是一个性质与我们在寻常经验中熟悉的任何事物都截然不同的新概念。
困扰爱因斯坦10年的疑惑是这样的:19世纪中期,苏格兰物理学家麦克斯韦(James Clerk Maxwell)在认真研究了英格兰物理学家法拉第(Michael Faraday)的实验工作后,成功地把电和磁统一在电磁场的框架下。假如你曾在雷雨过后登上山顶,或者站在范德格拉夫发生器的旁边,[8]你对什么是电磁场一定有过切身的体验,因为你已经感觉到它了。假如你还没有那种经历,你可以想象那是电和磁的力线的波浪流过它们所经过的空间区域。例如,当你把铁粉洒在磁铁旁边时,它们形成的有序排列就显示了一些看不见的磁力线。当你在特别干燥的日子脱下羊毛衫时,你会听到“嘶嘶”的声响,可能还会感觉有点儿哆嗦,其实,那就是从羊毛衫纤维脱落下的电荷产生的电力线。麦克斯韦理论不但把这样那样的电和磁的现象统一在一个数学框架里,而且还出人意料地发现电磁扰动以恒定不变的速度传播——后来发现,那个速度就是光速。根据这一点,麦克斯韦意识到,可见光不过是一类特殊的电磁波,我们现在知道,它与视网膜的化学物质发生反应,就产生视觉。另外(这一点很重要),麦克斯韦理论还说明,所有的电磁波都是典型的逍遥客,它们永不停歇,也永不减缓脚步。光总是以光速运动的。
这时还没有什么问题,但问题跟着就来了,那也是16岁的爱因斯坦问过的:假如我们以光的速度追光,会发生什么事情呢?直觉告诉我们,根据牛顿的运动定律,我们将赶上光波,于是光波就像静止不动的——光停在那儿了。然而,根据麦克斯韦的理论和所有可靠的观测,根本没有那样的静止的光;谁也不曾抓一把光在手上。这就是个问题。幸好,爱因斯坦不知道全世界有许多杰出的物理学家正在同这个问题斗争(而且走过许多令人迷失的路线),他在凭着自己独特自由的思路考虑麦克斯韦与牛顿的疑惑。
在这一章里,我们来讨论爱因斯坦如何通过他的狭义相对论解决这个矛盾,如何永远地改变了我们关于空间和时间的概念。也许有人奇怪,狭义相对论首先关心的是,相对运动着的个人(通常叫“观察者”)所看到的世界是什么样的。乍看起来,这不过是没有一点儿意思的智力游戏。事实正好相反,在爱因斯坦的手下,追光的想象隐藏着更深刻的意义。他发现,即使最寻常的事物,在相对运动的观察者看来也会表现最奇异的现象。
直觉和错觉
寻常的一些经验能告诉我们各人看到的事情怎么会不同。例如,路边的树木在驾驶者看来是运动的,而从坐在护栏里等车的人看却是静止的。同样,汽车上的仪表盘在司机看来是不动的(当然不动啦!),但在等车人看来,却是跟着汽车的其他部分一起走的。这些现象太普通、太直观,我们几乎不怎么留意。
然而,狭义相对论认为,不同观察者所看到的现象的不同有着微妙而深刻的意义。它令人惊奇地指出,相对运动的观察者将感觉不同的距离和时间。我们会看到,这就是说,戴在两个相对运动着的人手上的相同的手表会有不同的节律,从而对任意两个事件之间的时间间隔,也有不同的结果。狭义相对论指出,这个结论并不是说表的精度有问题,它说的是时间本身。
同样,拿着相同皮尺的两个相对运动的观察者将量出不同的距离。这当然还是与他们的测量方法的误差和测量设备的精度无关。世界上最精确的测量仪器也证明,每个人所经历的空间距离和时间间隔是不同的。爱因斯坦的狭义相对论以准确的方式解决了我们关于运动的直觉和光的性质的矛盾,但是也付出了代价:相对运动的观察者不再会看到相同的空间和时间。
自爱因斯坦向世界宣布他那惊人的发现以来,近百年过去了,而我们今天大多数人还在把空间和时间当成绝对的东西。狭义相对论没有深入人心——我们感觉不到它。它的意义在我们的直觉以外。原因很简单:狭义相对论效应依赖于我们的运动速度,而在汽车、飞机甚至宇宙飞船的速度,这些效应是微不足道的。站在地上的人和坐在汽车或飞机上的人的确经历着不同的空间和时间,不过那差别太小而没人注意。然而,假如有人能坐上未来的宇宙飞船以接近光的速度去旅行,相对论效应将变得十分显著。当然,这在今天还是科幻小说的话题。不过,在后面的章节我们将讨论,聪明的实验家们会让我们清楚而准确地看到爱因斯坦理论预言的空间和时间特性。
为实在地感觉上面提到的那些测量,让我们回到1970年,那时刚出现高速的大汽车。斯里姆刚用所有积蓄买了辆新Trans Am赛车,这会儿同兄弟吉姆一道来参加当地的汽车短程加速比赛,想试试那车怎么样(而车商是不会让他们那么试车的)。斯里姆加大油门,汽车飞也似地以120千米/时的速度跑在那1千米长的跑道上,而吉姆则站在跑道旁为他测时间。为相互验证,斯里姆自己也拿秒表测量他的新车跑过这段路需要多长时间。在爱因斯坦以前,不会有人怀疑斯里姆和吉姆会测得完全相同的时间,只要他们的表运行正常。但是依照狭义相对论,如果吉姆的表测得的时间是30秒,那么斯里姆记录的时间将是29.99999999999952秒——小一丁点儿。当然,只有当我们的测量精度远远超过秒表、超过奥运会的计时系统,甚至超过最精确的原子钟,才可能确定那么微小的差别。难怪我们在日常生活中感觉不到时间的流逝依赖于我们运动的状态。
对长度的测量,兄弟俩也会有不同的意见。例如,在下一轮试车时,吉姆用了一种很巧妙的办法来测量斯里姆的新车的长度:当车头经过身边时,打开秒表,车尾经过时,把它按下。因为吉姆知道哥哥的汽车在以120千米/时的速度前进,所以拿速度乘以他秒表上的时间,就能得到车的长度。当然,在爱因斯坦之前,也不会有人怀疑吉姆以这种直接方法测得的长度与斯里姆在汽车停在车棚里测量的长度是完全一样的。但是,狭义相对论指出,如果兄弟两人用这种办法精确测量了汽车的长度,比如说,斯里姆测得的正好是5米,那么吉姆将发现它是4.99999999999974米——短了一点儿。与时间测量一样,这么小的差别是寻常仪器无法测量的。
差别尽管很小,还是暴露了大众拥有的普适不变的空间和时间概念的致命缺陷。当斯里姆和吉姆的相对速度越来越大时,这缺陷也越来越明显。不过,只有当速度接近最大可能速度(光速)——麦克斯韦理论和实验证明为每秒300000千米——才可能出现可以觉察的差别。那速度足以在1秒钟里绕地球7圈半。如果斯里姆的速度不是120千米/时,而是9.4亿千米/时(光速的87%),狭义相对论预言,吉姆测得的车长将是2.4米左右,大大不同于斯里姆的测量(也就是用户手册上标明的长度)。同样,在吉姆看来,短程赛车的时间将比斯里姆测量的时间大1倍。
今天几乎没有东西能达到那样的速度,所以这些专业上所说的“时间延缓”和“洛伦兹收缩”现象,在日常生活里没有产生什么效应。假如在我们生活的世界里,事物都普遍以接近光的速度运动,那么空间和时间的这些性质也就完全成了我们的直觉——因为随时都在经历着它——从而就像开头说的路旁的树木那样,也用不着多加讨论了。但是,我们并不生活在那样的世界,所以那些性质还是陌生的。我们会认识到,只有彻底改变自己的世界观,才能理解和接受那些性质。
相对性原理
构成狭义相对论基础的是两个简单然而扎实的原理。一个我们已经提过了,与光的性质有关,在下一节我们还要详细讨论;另一个更抽象,它讲的不是任何具体的物理学定律,却与所有物理学定律都有关系,那就是著名的相对性原理。这个原理基于一个简单的事实:不论我们讨论速度的大小还是方向,都必须明确是谁或者用什么在测量。从下面的例子可以很容易地理解这句话的意思和重要性。
让我们想象,在远离星系、恒星和行星的地方,乔治穿着闪红光的太空服飘浮在黑暗的空无一物的空间。从他的角度说,他完全静止地浮在均匀宇宙的黑暗里。他看见远处闪烁着一点绿光,越来越向他靠近。终于,那光走近了,原来是从另一位太空流浪者格蕾茜的太空服发出的,她正慢慢飘过来。经过他时,她向他挥了挥手,他也向她挥挥手。然后,她又消失在黑暗里。这个故事也完全可以从格蕾茜的立场来讲。开始的时候,格蕾茜独自飘浮在太空无边的黑暗中,她看到远处闪烁的红光在向她走来,后来她看清了,那光是从另一个人(乔治)的太空服上发出的。那人向她靠近,经过时也向她挥了挥手,然后消失在远方。[9]
两个叙述以两种不同但等价的观点讲了同一件事情。每个观察者都觉得自己是静止的,而看见别人在运动。每个人的观点都有道理,也都能理解。因为两个太空流浪者的地位是对称的,所以,从根本上说,我们不能讲谁的感觉是“对”还是“错”,他们都一样有理由说自己是对的。
这个例子抓住了相对性原理的精神:运动的概念是相对的。只有在相对于其他事物或与其他事物比较时,我们才能谈一个物体的运动。这样,说“乔治在以10千米/时的速度运动”是没有意义的,因为我们没有说明任何参照的对象。如果我们以格蕾茜为参照,那么这样讲就是有意义的:“乔治以10千米/时的速度经过格蕾茜。”正如我们的例子那样,最后这句话完全可以这样说:“格蕾茜以10千米/时的速度(从相对的方向)经过乔治。”换句话讲,没有“绝对的”运动概念,运动是相对的。
上面的例子中关键的一点在于,乔治和格蕾茜都不以任何方式受力的作用和影响,那些影响可能会改变他们静止的、不受力的作用的、匀速运动的状态。所以,更准确的说法是,只有在与其他对象比较时,不受力的运动才有意义。说明这一点是很重要的,因为,如果出现力的作用,它会改变观察者的速度——改变其大小和(或)方向——而这些改变是可以感觉的。例如,当乔治背着点火的喷气袋时,他准能感觉自己在运动。这种感觉是内在的。只要火箭点火了,乔治就知道他在运动,即使他闭上眼睛,不看周围的事物。即使没有什么比较,他也不会再说自己是静止的,而“其余的世界在他周围运动”。常速的运动是相对的,而非常速的运动(或者说,加速运动)却不是。(我们下一章考虑加速运动,讨论爱因斯坦的广义相对论时,还要回头来检验这种说法。)
让故事发生在太空的黑暗里,更有助于我们的理解,因为它避开了我们熟悉的街道和大厦——我们常常毫无理由地认为它们处在特殊的“静止”状态。实际上,相对性原理也同样适合于地球上的事物,而那也是我们经常遇到的。[1]举例来说,假设你在火车上睡着了,醒来时火车正在通过一段复线。你透过窗户往外看,却被另一列火车挡住了,什么也看不见。这时,你可能说不准是一列火车在动,还是两列都在动。当然,如果火车摇晃或者在弯道上,你会感觉在运动。但如果铁路是笔直的——而且火车速度不变——你只能看到两列火车的相对运动,而说不准是谁在动。
让我们更进一步。假如你在那列火车上,把窗帘拉下来,把车窗遮住,看不见车厢外的一点儿东西。又假设火车速度是完全不变的,那么,你无法确定自己的运动状态。不论火车停在路上还是高速开着,你看到的车厢都是完全一样的。这样的思想,其实还可以追溯到伽利略,爱因斯坦是通过下面的论断建立起来的:不论是谁,都不可能在这样封闭的车厢里通过实验来决定火车是否在运动。这也是相对性原理:一切不受力的运动都是相对的,只有通过与其他不受力的运动物体或观察者的比较才有意义。如果不与“外面的”事物进行比较,你就不可能知道自己处在什么运动状态。根本没有什么“绝对的”匀速运动,只有比较才有物理意义。
实际上,爱因斯坦发现,相对性原理还有着一个更响亮的论断:不论什么物理学定律,对所有匀速运动的观察者来说都是完全相同的。假如乔治和格蕾茜不是孤零零地飘浮在太空,而是在各自的太空站里做同一组实验,那么他们的实验结果还是相同的。每个人都一样有理由相信自己的太空站是静止的,尽管两个站是相对运动着的。如果他们所有的仪器都一样,两个实验室就没有什么分别——是完全对称的。他们从实验得出的物理学定律也是相同的。无论他们自己还是他们的实验,都不可能感觉到匀速运动——也就是说,不以任何方式依赖于那种运动。就是这个简单的概念在两个观察者之间建立起完全的对称关系;就是这个简单的概念体现了相对性原理的精神。很快我们会将这个原理用于重大的效应。
光速
狭义相对论的第二个关键因素与光和光的运动性质有关。我们说过,“乔治以10千米/时的速度运动”这句话离开比较对象是没有意义的,然而光却不同。一个世纪以来,大量实验物理学家的努力都证明,一切观察者都同意光以300000千米/秒的速度运动——不论以什么标准为参考。
这个事实变革了我们的宇宙观。为弄懂它的意义,我们先来看,那个关于光速的论断对普通的事物是不是对的。想象一下,在一个明媚的日子里,你跟朋友出去玩沙滩排球。你们快乐地把球传来传去(速度比如说是6米/秒)。忽然,天上电闪雷鸣,你们赶紧跑去找躲雨的地方。雨过天晴,你们又重新玩起来。可是你发现有点不对劲儿,朋友的头发乱蓬蓬的,两眼变得凶恶而疯狂。再看她的手,你惊奇地发现她手上拿的不是什么球,而是要把一颗手榴弹扔给你。当然了,你玩球的热情一下子烟消云散了,转身拔腿就跑。你的伙伴扔出手榴弹向你飞过来,但因为你也在跑,所以它向你追来的速度比6米/秒小。实际上,经验告诉我们,如果你跑的速度是4米/秒,那么手榴弹向你飞来的速度是(6-4=)2米/秒。再看一个例子:假如你在山上忽然遭遇雪崩,你首先想到的是跑,因为那样雪向你压过来的速度会慢下来——这当然是好事。同样,静止的观察者看到的雪速度要比逃跑者感觉的快。
现在,我们来比较一下排球、手榴弹、雪崩与光有哪些基本差别。为了让比较更密切,我们想象光是由一“束束”或一“包包”光子组成的(光的这点性质我们在第4章还要更详细地讨论)。当我们打开手电筒或者激光器时,实际上就在向某个方向发射光子流。像手榴弹和雪崩的例子一样,我们来看,运动的观察者看到的光子是如何运动的。假定你那位发了疯的朋友把手榴弹换成大功率的激光向你射过来——你可以发现(假如你有很好的测量仪器),光子束的速度为10.8亿千米/时。但是,假如你像看到手榴弹飞过来时拔腿就跑,情况会怎样呢?光向你飞来的速度会是多大呢?为了更令人相信,请你坐上“冒险者”号飞船,以1.6亿千米/时的速度逃离你的伙伴。这样,照传统的牛顿世界观,你大概以为光子飞向你的速度会慢一些,因为你也在跑。具体地说,你预料它们向你靠近的速度是(10.8-1.6=)9.2亿千米/时。
自1880年以来,大量不同的实验以及对光的麦克斯韦电磁学理论的分析和解释,逐渐令科学家们相信,你不会看到你想象的那种事情。实际上,不论你怎么跑,你总会发现光子向你飞来的速度是10.8亿千米/时,一点儿也不会慢。乍听起来,这似乎很荒唐,一点儿也不像我们在排球、手榴弹和雪崩时发生的事情。然而,事实就是那样。不论你迎着光还是追着光跑,它靠近或离开你的速度是不会改变的,都是10.8亿千米/时。不论光子源与观测者如何相对运动,光速总是一样的。[2]
由于技术的局限,上面说的那些“实验”实际不可能完成。不过,比较的实验还是可以做的。例如,荷兰物理学家德西特(Willem de Sitter)在1913年提出,快速运动的双星(两颗相互绕对方旋转的恒星)可以用来测量光源的运动对光速的影响。80多年来,许许多多的这类实验都证明来自运动恒星的光与来自静止恒星的光具有相同的速度——在不断提高的仪器精度下,都是10.8亿千米/时。另外,在过去的百年里,在不同环境下做了许多直接测量光速的实验,还检验了光的这种性质所带来的许多结果——它们都证明,光速是一个常量。
如果你觉得光的这种性质很难理解,那不是你一个人的问题。在19世纪和20世纪之交的那些年,曾有许多物理学家想尽办法来反对它,但都失败了。爱因斯坦不一样,他欣然接受了不变的光速,因为它解决了困惑他10多年的矛盾:不论你怎么费力去追赶,光总是以光速跑在你的前头。你不可能觉察光速有一丁点儿的差别,当然更不可能让光慢慢停下来。问题解决了,但不仅仅是战胜了一个难题。爱因斯坦发现,不变的光速意味着牛顿物理学的崩溃。
事实和结论
速度度量一个物体在一定时间间隔内能走多远。如果坐在速度为65千米/时的汽车上,我们在1小时里当然走了65千米(只要在这个小时内我们保持相同的运动状态)。这样说来,速度是很普通的概念。那么有人可能奇怪,我们为何还费大力气去谈什么排球、雪球和光子的速度。但是请注意,距离是关于空间的概念——特别是它度量了两点间有“多少”空间。另外还应注意,间隔是关于时间的概念——两个事物之间经历了多长时间。于是,速度最终是与我们的空间和时间概念联系着的。这样我们看到,挑战我们寻常的速度概念的那些实验事实,如光速的不变性,实际上也在挑战我们寻常的空间和时间概念本身。因为这一点,光速的奇特性质值得更仔细地研究——爱因斯坦通过对它的考察,得到了惊人的结果。
同时性
根据光速的不变性,可以毫不费力地证明我们平常熟悉的时间概念是完全错误的。假定有两个敌对国的元首,分别坐在长长的谈判桌的两头。他们刚达成停战协议,可谁也不愿先在协议上签字。联合国秘书长走过来,他想到一个绝妙的解决办法。把一盏灯放在桌子的中间,灯光会同时到达两位总统(因为他们距离灯是一样远的)。当两个总统看到灯光时,就在协议文本上签字。就这样,协议在双方都满意的情况下达成了。
秘书长很高兴,又用同样的办法来调解另外两个正在备战的国家。不同的是,谈判在匀速行驶着的火车上进行。两个国家的总统坐在谈判桌的两头,“前卫国”总统面对火车前进的方向,“后卫国”总统面对他坐在对面。秘书长知道,只要运动状态保持不变,物理学定律就总是一样的,而与各人的运动状态无关,所以谁坐在哪头是没有关系的。他又主持了那种“灯光签字仪式”。两位总统签署了协议,与幕僚们共同庆祝两国结束敌对关系。
这时候,有人来报告,在车外站台上看签字仪式的两国群众打起来了。谈判列车上的人很震惊,他们听说两国群众冲突的原因是“前卫国”的人感觉自己受骗了,因为是他们的总统先在协定上签了字。而车上的人——不论哪一方——都认为签字是同时进行的。外面的人怎么会看到不同的场面呢?
让我们更仔细地来考虑站台上的人所看到的情形。当初,谈判桌上的灯是关着的,然后在某个时刻打开,光传向两位总统。从站台上看,“前卫国”总统迎着照过来的光,而“后卫国”总统则在离开光。这就是说,对站台上的人而言,灯光离“前卫国”总统的传播路线比离“后卫国”总统的更短,因为一个迎着光来,一个离光而去。这不是说光的速度在射向两位总统时有什么不同——我们已经讲过,不论光源和观察者的运动状态如何,光速都是相同的。我们这里说的只是,从站台上的观察者的观点看,光到达两个总统所经历的距离有多远。因为光到“前卫国”总统的距离比到“后卫国”总统的短,所以它将先到达“前卫国”的总统,这就是为什么“前卫国”的公民说自己上当了。
当有线新闻网(CNN)广播群众看到的情景时,联合国秘书长、两国总统以及幕僚们都惊呆了,简直不敢相信自己的耳朵。他们都看到灯肯定是精确地放在两位总统的正中央的,如果没有什么干扰,灯发出的光传到他们的距离是一样的。因为光向左和向右的速度相同,他们相信——而且确实看到了——光真的是同时到达两个总统的。
车上车下的人,谁对谁错呢?双方看到的和解释的理由都无懈可击。答案是,两方都是对的。像乔治和格蕾茜那两位太空行者的情形一样,两种观察结果都有理由说是正确的。唯一令人疑惑的是,这里的两种情形似乎是相互矛盾的。出现了棘手的政治问题:两位总统是同时签字的吗?以上面的观察和理由使我们不得不相信,根据列车上的人的观点,他们是同时签字的,而根据站台上的人的观点,他们不是同时签字的。换句话讲,如果两个观察者是相对运动的,那么在一个人看来同时发生的事情,在另一个人看来是不同时的。
这是一个惊人的结论,是对实在本性最深刻的洞察之一。不过,即使多年以后你忘了这一章讲的事情,而还能记得那艰难的和平历程,那么你还是把握了爱因斯坦发现的精髓。时间的这种出人意料的性质,不需要令人皱眉的数学,也不需要眼花缭乱的逻辑,它是光速不变性的直接结果,这一点我们已经说过了。我们现在来看,如果光速不是常数,而像我们直觉认为的那样,像排球、雪球的速度那样变化,那么站台和列车上的人的意见就不会有冲突了。站台上的人还是会说,光离“后卫国”总统的距离要比离“前卫国”总统远一点儿,但直觉告诉我们,光飞向“后卫国”总统的速度也要快一点儿,因为向前奔驰的火车也在给它“加劲儿”。同样,他们会看到光飞向“前卫国”总统的速度会慢一点儿,因为向前的列车会将它“拖住”。考虑了这些效应(当然是错误的),站台上的人们会看到光同时到达两位总统。然而,在现实世界里,光不能被加速,也不会慢下来,所以火车既不可能使它更快,也不可能使它变慢。于是,站台上的观察者最终还是会说光先到达“前卫国”的总统。
千百年来,我们一直以为同时性的概念是普适的,不论运动状态如何,都是大家公认的;然而,光速不变性要求我们放弃这种观念。我们曾经幻想一种普适的时钟,不论在地球、火星、木星还是在仙女座星系,它在宇宙的每一个角落都能以完全相同的节律,一分一秒地走下去。现在看来,这样的钟是不可能存在的。反过来说,相对运动的观察者对事件是否同时发生,会有不同的看法。然而,还是因为我们寻常遇到的速度太小,所以我们世界的这种实实在在的特征对我们来说依然是陌生的。假设谈判桌长30米,火车以16千米/时的速度运行,那么站台上的人们会“看到”光到达“前卫国”总统的时间比到达“后卫国”总统的时间要早大约一千万亿分之一秒。虽然这是真正的差别,但确实太小了,我们不可能直接感觉得到。假如火车快得多,每小时跑10亿千米,那么,站台上的人会看到光到达“后卫国”总统的时间要比到“前卫国”总统多20倍。在高速情况下,狭义相对论的惊人效应就越发显著了。
时间的延缓
很难为时间下一个抽象的定义——那常常会把“时间”本身卷进来,要不就得在语言上兜圈子。我们不想那么做,而采取一种实用的观点,将时间定义为时钟所测量的东西。当然,这也把定义的负担转给了“时钟”。这里,我们不那么严格地将时钟理解为一种做着完全规则的循环运动的仪器。我们通过计数时钟经过的循环次数来测量时间。像手表那样的寻常钟表是满足这个定义的,它的指针规则地一圈一圈地转,而我们也的确通过它的指针在两个事件之间转的圈数来确定时间。
当然,“完全规则的循环运动”也隐含着时间的概念,因为“规则”指的正是每一个循环经历相同的时间间隔。从实用的立场出发,我们用简单的物理过程来建立时钟,就是说,我们希望它在原则上反复地循环,从一个循环到下一个循环不发生任何方式的改变。古老的来回摇荡的摆钟和以重复的原子过程为基础的原子钟,为我们提供了简单的例子。
我们的目的是认识运动如何影响时间的流逝。既然我们已经以操作的方式用钟的运动定义了时间,那么也可以将问题转换为:运动如何影响钟的“嘀嗒”?首先应强调一点,我们的讨论并不关心某个特殊的钟的机械零件会在摇晃、碰撞中发生什么事情。其实,我们要讲的只是最简单最平凡的运动——速度绝对不变的运动——这样也不会有摇晃或碰撞。我们真正感兴趣的是一个普遍性的问题:运动如何影响时间的流逝,也就是说,如何根本地影响任何钟的节律,而与钟的具体设计和构造无关。
为此,我们引入一种最简单的概念性的(不过也是最不实用的)钟,那就是所谓的“光子钟”。它由安在架子上的两面相对的小镜子组成,一个光子在两面镜子间来回反射(图2.1)。假定镜子相隔15厘米,光子来回一趟需要大约十亿分之一秒。我们可以把光子的一次来回作为光子钟的一声“嘀嗒”——嘀嗒10亿声就意味着经过了1秒。
图2.1 两面平行镜子构成的光子钟,中间有一粒光子。光子每完成一次往返,钟就“嘀嗒”一声
我们可以拿光子钟做秒表来测量两个事件的时间间隔:只需要数一下在我们感兴趣的期间里听到了多少次“嘀嗒”声,然后用它乘以每次“嘀嗒”所对应的时间。例如,我们测量一场赛马的时间,从开始到结束,光子来回的次数为550亿次,那么我们知道赛马经过了55秒。
我们用光子钟来讨论是因为它的力学性质很简单,而且摆脱了许多外来的影响,从而能让我们更好地认识运动如何影响时间过程。为看清这一点,我们来仔细看看身边桌上的光子钟是怎么计时的。这时候,忽然从哪儿落下另一只光子钟,在桌面上匀速地滑过(图2.2)。我们的问题是,运动的钟与静止的钟会以相同的节律“嘀嗒”吗?
为回答这个问题,让我们从自己的角度来看光子在滑动的钟内为了一声“嘀嗒”该走的路径。如图2.2,光子从滑动着的钟底出发,然后到达上面的镜子。在我们看来,钟是运动的,光子的路径应该像图2.3那样是斜的;如果光子不走这条路,就会错过上面的镜子而飞向空中。然而,滑动的钟也有理由说自己是静止的而其他东西在运动,我们也知道光子一定会飞到上面的镜子,所以我们画的路线是对的。然后,光子从上面反射下来,沿着另一条斜线落回下面的镜子,“敲响”滑动的钟。显然,我们看见的光子经历的两条斜线比光子在静止的钟里从上到下的直线更长,因为从我们的视角看,光子不仅上下往返,还必须随滑动的钟从左飞到右。这一点是有根本意义的。另外,光速不变性告诉我们,滑动钟的光子与静止钟的光子一样,都以光速飞行。光子在滑动的钟里需要飞过更长的路径,所以它“敲响”的钟声会比静止的钟少。这个简单的论证说明,从我们的视点看,运动着的光子钟比静止的光子钟“嘀嗒”得慢。而我们已经认为“嘀嗒”的次数反映了经历时间的长短,因此我们看到,运动的钟的时间变慢了。
图2.2 前面是静止的光子钟,另一只光子钟匀速滑过
图2.3 从我们的视点看,光子在滑动的钟里走过一条折线
你可能想问,也许这不过是光子钟的特殊性质,未必适合于古老的摆钟或者劳力士手表。这些更熟悉的钟表测得的时间也会慢吗?我们可以响亮地回答“是的”,可以用相对性原理来证明。在光子钟上系一只劳力士表,重复刚才的实验。我们已经讲过,静止的光子钟和系在上面的劳力士表所测量的时间是一样的,光子钟“嘀嗒”10亿次,劳力士表走1秒钟。如果光子钟和劳力士表在运动呢?劳力士表会像光子钟那样也同步地慢下来吗?为使问题更明白,我们把钟和表固定在列车车厢的地板上,车厢没有窗户,列车在笔直光滑的铁路上匀速地滑行。根据相对性原理,车上的人谁也没有办法判断列车是否在运动。但如果劳力士表和光子钟不同步,他们就可以凭这一点发现运动的效应。因此,运动的钟和钟上的表一定测量相同的时间间隔;劳力士表一定以完全相同的方式像光子钟那样变慢了。不论什么牌子、什么类型、什么结构的钟表,只要在相对运动,它们就会测量出不同的时间节律。
光子钟的讨论还说明,静止与运动的钟的时间差决定于滑动钟的光子完成一次往返飞行需要经过的距离,而这又决定于钟滑动的速度——从静止的观察者看,钟滑动越快,光子飞行越远。所以,与静止的钟相比,滑动的钟滑得越快,它“嘀嗒”的节律就越慢。[3]
为了对时间大小有一点感觉,我们注意光子来回一趟大约是十亿分之一秒。能在“嘀嗒”声中经过一段可以觉察的路径的钟一定运动得很快——那速度与光速差不多。假如它以寻常的16千米/时的速度运动,则在光子走完一个来回时它才移动了五百亿分之一米。这个距离太小,从而光子经过的距离也小,相应地,对钟的影响也小了。根据相对性原理,这同样适合于所有的钟——也就是说,适合于时间本身。这也是为什么我们这些以低速度相对运动的生命一般都感觉不到时间的扭曲。那效应虽然肯定存在着,却是小得惊人。相反,假如我们能抓着滑动的钟,跟它一起以3/4光速运动,那么我们可以用狭义相对论方程证明,静止的观察者会发觉我们运动的钟的节律大约只是他们的钟的2/3,这实在是显著的效应。
运动的生命
我们看到了,光速不变性意味着运动的光子钟比静止的光子钟的“嘀嗒”节律慢,而根据相对性原理,这不仅对光子钟来说是正确的,也适合于任何类型的钟——也就一定适合于时间本身。运动的观察者的时间过得比静止观察者的慢。照这样的推理,运动着的生命岂不是比静止的生命活得更长吗?毕竟,假如运动的时间比静止的时间慢,那么这种差别不应仅适用于钟表测量的时间,也同样适用于心跳和身体器官衰老所决定的时间。真是这样的,它已经得到了直接证实——不是人的寿命延长了,而是来自微观世界的某种粒子(μ子)的寿命延长了。然而,我们却不能说找到了青春的源泉,因为面前还有巨大的困难。
在实验室里处于静止状态时,μ子经过类似放射性衰变的过程,在大约一百万分之二秒的时间内发生分裂,这是得到无数证据证明了的实验事实。μ子仿佛举着一支枪顶着自己的头,在一百万分之二秒时扣动扳机,把自己击碎,分裂成电子和中微子。但是,假如μ子不是静止在实验室里,而是在某个粒子加速器里,它将获得只比光慢一点的速度。实验室的科学家会发现它的平均寿命惊人地延长了。确实如此。以10.73亿千米/时(约99.5%的光速)运动的μ子,寿命大约会增大10倍。照狭义相对论的解释,快速运动的μ子“戴”的表比实验室里的钟慢得多,当实验室钟声响起该它开枪时,它的表还远没到那“最后的时刻”。这说明了运动对时间过程直接而惊人的影响。假如谁能像μ子那么快地飞翔,他的生命也会一样地延长。原先活70岁的,会活到700岁。[4]
现在我们来看那困难是什么。实验室的人看到高速运动的μ子比它静止的伙伴活得更长,那是因为对运动者来说,时间走慢了。不仅μ子的表慢了,它经历的一切活动都慢了。例如,假如静止的μ子一生能读100本书,它那运动的兄弟也只能读100本书——尽管它的寿命长多了,但它阅读的速度和它生命的一切活动也都慢下来了。从实验室看,运动的μ子会比静止的活得更长,但它经历的“生命的总和”却是一样多。这个结论当然也适用于那些高速运动的能活几百岁的人。在他们自己看来,生命如故。在我们看来,他们过着超慢节奏的生活,他们的一个普通生命周期要经历我们漫长的时间。
谁在运动
运动的相对性既是爱因斯坦理论的钥匙,也是混乱的根源。你大概已经注意了,如果换一个角度看,那么时间过得慢的“运动的”μ子与“静止的”μ子将相互改变角色。像乔治和格蕾茜都能说自己是静止的一样,我们讲的运动的μ子完全可以从它自己的角度说它没有动,真正(在相反方向)动的是那“静止的”伙伴。从这个角度看,前面的论证同样是成立的,于是我们得到一个表面上很矛盾的结果:我们所讲的静止的μ子的时间,相对于我们所讲的运动的μ子的时间,慢了。
在“灯光签字仪式”的例子中,我们曾遇到过这样的情形:不同观点会带来离奇的结果。在那里,我们被迫根据狭义相对论的基本论证放弃了这样一个根深蒂固的旧观念:不论在什么样的运动状态,人们对事件发生的时间会有一致的认识。而眼前的冲突似乎更严重。两个观察者怎么可能都说对方的表慢了呢?更令人惊讶的是,两个不同的μ子的观点使我们面对这样一个严酷而悲哀的境地:两个兄弟都说自己会先离开这个世界。我们知道世界上会发生一些出人意料的怪事,但我们还是不希望出现逻辑荒唐的事情。究竟是怎么一回事呢?
像狭义相对论出现的其他悖论一样,仔细考察这些逻辑怪圈会带来对宇宙行为的新认识。为避免过分的拟人化,我们不谈μ子兄弟了,还是来看乔治和格蕾茜。现在,他们除了太空服上的闪光灯以外,还带着明亮的数字钟。在乔治看来,他是静止的,而格蕾茜的灯光和她巨大的数字钟出现在远处,然后从黑暗的虚空空间走过来,经过他。他发现她的钟比自己的慢(慢多少则依赖于他们相互经过的速度是多大)。如果再机灵一点儿,他还会发现,不仅她身上的钟慢了,她的一切都慢了——她经过时挥手的动作慢了,她眨眼睛的速度慢了……在格蕾茜看来,这些缓慢的运动同样发生在乔治身上。
虽然这显得很奇怪,我们还是来看一个揭示逻辑荒谬的精确实验。最简单的办法是,让乔治和格蕾茜相遇时把他们的钟都拨到12:00。两人分开后,都说对方的钟慢了。为看个究竟,他们只好又回到一起,直接比较钟的时间。不过,他们怎样才能再相遇呢?既然乔治带着喷气袋,他当然可以利用它来追格蕾茜(从他的角度看)。但是,如果他真那么做,那引发悖论的两人的对称关系就被破坏了,因为乔治现在经历着加速,而不是没有力作用的自由运动。当他们这样重逢时,乔治的钟真的慢了,他可以肯定地说自己在运动,因为他感觉到了。乔治与格蕾茜的观点不再相同。打开喷气袋时,乔治就不再说自己是静止的了。
假如乔治就这样追赶格蕾茜,他们的相对速度和乔治喷气的具体方法将决定两人的时间会有多大差别。我们现在已经知道,如果相对速度小,时间差别也会很小;如果速度同光速差不多,则时间差可能会是几分钟、几天、几年、几百年,甚至更大。考虑一个具体的例子:乔治和格蕾茜以99.5%的光速分离,3年以后(据乔治的钟),乔治在瞬间点燃他的喷气袋,以同样的速度去追格蕾茜。当他追上她时,6年过去了——这是他的钟所经历的时间,因为他需要3年才赶得上格蕾茜。然而,狭义相对论的数学证明,格蕾茜的钟这时已过了60年。这不是什么梦幻:格蕾茜得追寻60年前的记忆,才会想起她经过乔治的那一刻。而对乔治来说,那不过是6年前的事情。乔治真的成了时间行者,准确地说,他走进了格蕾茜的未来。
让两个钟回到一起来面对面地比较,这似乎只是一个逻辑小把戏,然而的确触及了问题的核心。我们想过很多办法来克服这点疑惑,最终都失败了。例如,我们不让钟回到一起,而让乔治和格蕾茜通过网络电话联系来比较他们的时间,事情会如何呢?如果这种联系是瞬间的,我们就不得不面对一个难以逾越的障碍:从格蕾茜的角度看,乔治的钟走得较慢,所以他通报的时间一定会小些;从乔治的角度看,格蕾茜的钟走得更慢,所以她通报的时间一定会小些。两个人不可能都是对的,而我们却糊涂了。问题的关键在于,网络电话同所有通信方式一样,不是瞬时传递信号的。电话经过无线电波(光的一种)传达信号,因此信号也以光速传播。这意味着接收信号需要一定的时间——实际上,正是这一时间延迟,将彼此的观点协调起来了。
我们先从乔治的角度来看。假定在每小时整点的时候,乔治就在电话里报告,“现在是12点整,一切正常”,“现在是1点整,一切正常”……在他看来,格蕾茜的钟走得慢,所以他开始以为她的钟在她收到通话后还没走到那个钟点。于是,他认为,格蕾茜会同意她的钟走得慢。但他马上又想,“格蕾茜在离我而去,我给她的电话一定要经历更远的距离才能到达她。也许,这多出的传话时间正好补上她走慢的钟。”乔治想到了存在着两种对立的效应——一方面,格蕾茜的钟走得慢;另一方面,他的信号传播需多费些时间——于是,他满怀热情地坐下来计算这两个效应的综合结果。他发现,传播信号需要的时间超过了格蕾茜的钟慢的那段时间。结论令他惊讶:格蕾茜要在她的钟过了那点以后才能收到他报告那点的电话。实际上,乔治知道格蕾茜也精通物理学,知道她在根据他的电话确定他的时间时,会把信号传播的时间考虑进来的。经过更多的计算,我们会证明,即使考虑了信号传播的时间,格蕾茜在分析他的信号后,也会得到这样的结论:乔治的钟比她的慢。
从格蕾茜的角度看,让她向乔治发正点报时信号,上面的论证也一样适用。起初,她觉得乔治的钟走得慢,因而会在他到点以前收到她的正点消息。但她接着考虑了她的信号一定要走得远一些才能追上正消失在黑暗中的乔治,于是她意识到,他实际上会在发出自己的正点信号以后才能收到她的消息。她同样意识到,即使乔治考虑了信号传播的时间,他也会根据她的电话得到结论:她的钟比他自己的慢。
只要乔治和格蕾茜都没有加速,他们两个的观点就都是站得住脚的。尽管表面看来像一个悖论,但他们却通过这种方式发现,在认为对方的钟走得慢这一点上,他们是完全一致的。
空间的收缩
上面的讨论说明观测者会看到运动的钟比自己的钟走得慢——就是说,运动影响时间。向前一小步,我们可以看到运动也同样惊人地影响着空间。我们回头来看斯里姆兄弟和他们的短距离试车。我们讲过,当汽车还停在展厅时,斯里姆就用皮尺认真测量过新车的长度。当汽车在跑道上飞驰时,吉姆不可能再用皮尺去量,只好用一种间接的办法。我们在前面曾提过一个办法:在车头经过时,吉姆打开秒表;车尾经过时,吉姆按下秒表,然后,用这个时间乘以汽车的速度,就能确定车的长度。
根据刚发现的时间特性,我们知道,在斯里姆看来,自己是静止的,吉姆是运动的。于是,他看到吉姆的钟走慢了。结果,斯里姆认为吉姆用间接方法测量的汽车长度比他自己在车库测量的短。因为,在吉姆的计算里(车长等于速度乘以经过的时间),他用的是走得慢的表测量的时间。既然表慢了,他看到的时间短了,他计算的结果一定也短了。
于是,吉姆将感觉斯里姆的汽车在运动中会变得比在静止时短。这不过是一个例子。一般情况下,观察者会看到运动的物体在运动方向上缩短了。[10]例如,狭义相对论的方程证明,如果物体以90%的光速运动,那么静止的观察者将发现它比静止时短了80%。图2.4画出了这个现象。[5]
图2.4 运动物体在运动方向上缩短了
在时空里运动
光速不变性引出一种新的空间和时间概念,取代了传统的固定的刚性结构的空间和时间观念。在新的概念里,空间和时间的结构密切依赖于观察者和被观察者之间的相对运动。我们已经认识到运动物体的演化慢了,在运动方向上的长度也缩短了,本可以就这样结束这儿的讨论。然而,狭义相对论还提供了一个更为深刻的统一的观点,能囊括所有这些现象。
为了理解这个观点,我们想象有辆不那么现实的汽车,能很快达到省油速度,160千米/时,然后保持这个速度,不快也不慢,最后突然刹车停下来。这时候,斯里姆高超的驾驶技艺越来越出名了,于是人们请他在广袤平坦的大沙漠上的一条笔直的路上试开这辆汽车。从起点到终点,路线长16千米,汽车6分钟(1/10小时)就能开过去。吉姆这回充当汽车技师,检查12组试车数据。令他困惑的是,尽管多数记录的时间都是6分钟,但最后三次却长一些:6.5分钟、7分钟、7.5分钟。起初他怀疑是机械故障,因为这几个时间说明汽车在最后三轮的试验中速度没能达到160千米/时。但是,认真检查后,他相信汽车没有一点儿问题。他无法解释那些反常的时间,就去问斯里姆最后三轮的情况。斯里姆的解释很简单。他告诉吉姆,在最后三轮,天近黄昏,车从东头开向西头,他的眼睛正对着落山的太阳,于是把车开偏了一点儿。他还画了一张草图说明最后三轮的路线(图2.5)。现在明白了为什么那三轮的时间会长一些:从起点到终点偏了一个角度,路线更长了,因而相同的速度需经历更长的时间才能开过去。换句话说,当路线偏离一个角度时,160千米/时的速度有一部分耗在了从南到北的方向上,于是从东到西的速度就慢了一点儿,从而经过这段路线的时间会长一点儿。
像上面讲的,斯里姆的解释很容易理解;不过,我们在这儿重复它多少是为了下面在概念上的飞跃。南北方向和东西方向是汽车能自由活动的两个独立空间维度。(当然,它还可以在竖直方向上运动,例如爬过山坡。不过,在这儿不需要那样。)斯里姆的解释说明,即使汽车速度每回都是160千米/时,在最后三轮里,因为它在两个方向上运动,因而在东西方向上的速度就显得比160千米/时慢了。在前些轮试车时,那160千米/时的速度完全都跑在东西方向上;而在最后三轮,南北方向上也有了一定的速度。
图2.5 在黄昏阳光的照射下,斯里姆在最后三轮试车中路线越偏越远
爱因斯坦发现,这种运动在两个方向上分解的思想,正是狭义相对论一切惊人的物理学事实的基础——不过我们需要明白,不光是空间维分解运动,时间维也能“分享”运动。实际上,在大多数情况下,物体运动的大部分都是在时间而不是空间度过的。我们来看这是什么意思。
在空间发生的运动,我们很小的时候就知道了。我们也知道(尽管没有这样想过),我们和我们的朋友,以及我们所有的东西,也在时间里运动。当我们抬头看挂钟的时候,或者当我们悠闲地坐着看电视的时候,钟的读数在不停地变化,不停地“在时间里向前走”。我们和周围的一切事物都会变老,不可避免地在时间里从一刻走到下一刻。实际上,数学家闵可夫斯基(Hermann Minkowski)以及后来的爱因斯坦,都倡导把时间看成宇宙的另一维——第四维——就像我们想象自己浸在三维空间一样。这听起来很抽象,但时间维的概念却是具体的。当我们想会见某个人,我们会告诉他“在空间”的哪儿见面——如第7大道53街区一个角落的大楼的9楼。那地方由三条信息(第7大道,53街区,9楼)确定,是三维空间里的一个特定位置。然而,还有一点也同样重要,我们应确定在什么时候见面——如下午3点。这个信息告诉我们“在时间”的什么地方。于是,事件由4点信息来确定:3个空间的和1个时间的。这些数据就确定事件在空间和时间(或者简单地说,在时空)里的位置。在这个意义上,时间是另一维。
从这个观点说,空间与时间是全然不同的维度。那么,我们是不是还能像讲物体通过空间的速度那样来讲它通过时间的速度呢?当然可以。
能这么做的一大线索来自我们曾经遇到过的一个重要现象:当物体相对于我们在空间运动时,它的钟比我们的走得慢。就是说,它在时间里的运动速度慢了。现在来看爱因斯坦的思想飞跃,他宣布,宇宙间的一切事物总是以一个固定的速度——光速,在时空里运动。这是很奇怪的想法;我们习惯了物体运动速度远小于光速的观念,我们还反复强调这一点正是在日常生活中看不到相对论效应的原因。这都是对的。我们现在讲的是在四维——三维空间和一维时间——里的组合速度,这个推广的速度正好等于光的速度。为更彻底理解这一点,认识它的重要意义,我们还来看上面讲的那辆只有一个速度的汽车。那个速度可以在不同的维度里分解——不同的空间维和一个时间维。假如物体(相对于我们)静止不动,就是说,它不在空间运动,类似于第一轮试车,所有的运动都发生在一个维度里——不过,在现在的情形,那一维是时间。而且,相对于我们静止以及相互相对静止的所有物体,都在时间里运动——以完全相同的速度或节律衰老。然而,假如物体在空间运动,那么刚才讲的在时间的运动一定会转移一部分到空间来。跟汽车偏离路线一样,物体运动的转移意味着它在时间里的运动比静止时慢,因为有的运动现在转移到空间里去了。就是说,当物体在空间运动时,它的钟会变慢。这正是我们以前发现的结果。现在我们看到,相对我们运动的物体的时间变慢的原因,是它在时间里的部分运动转移为空间运动了。这样,物体在空间的运动只不过反映了有多少时间里的运动发生了转移。[6]
我们还看到,这个理论框架直接包含着一个事实:物体的空间速度有一定的极限。假如物体在时间里的运动完全转移到空间来了,物体在空间的运动就达到那个最大速度。也就是说,以光速在时间里运动的物体,现在以光速在空间运动。因为所有在时间里的运动都被占有了,因此这是物体——任何物体——所能达到的最大速度。这相当于说,我们试验的汽车直接在南北方向行驶。这时候,汽车在东西方向没有留下一点儿运动;以光速在空间运动的事物,同样也没有留一点儿在时间里的运动。因此,光不会变老;从大爆炸出来的光子在今天仍然是过去的样子。在光速下,没有时间的流逝。
E=mc2呢
尽管爱因斯坦没有宣扬他的理论是“相对论”(他建议叫它“不变性”理论以反映光速的不变性特征),我们现在还是明白了这个词的意思。爱因斯坦的研究证明,在过去似乎分离、绝对的空间和时间的概念,实际上是相互交织的,是相对的。他还接着证明,世上的其他物理性质也是出人意外地相互关联的。他最有名的方程为我们提供了一个重要范例。在这个方程里,爱因斯坦宣布,物体的能量(E)和质量(m)不是两个独立的概念;我们可以从质量(乘以光速的平方,c2)决定能量,也可以从能量(除以光速的平方)得到质量。换句话讲,能量与质量像美元与法郎一样,是可以兑换流通的。然而,与钞票兑换不同的是,这里的兑换率是光速的平方,总是固定不变的。由于这个因子很大,小质量能产生大能量。不足8.712克(0.02磅)的铀转化的能量,曾在广岛带来毁灭性的破坏;总有一天,我们可以利用取之不竭的海水,通过核聚变获得我们世界所需要的能量。
根据这一章强调的概念,爱因斯坦方程为我们最确切地解释了一个关键问题:没有什么东西能比光更快。你可能会奇怪这是为什么。例如,我们把一个μ子用加速器加速到10.73亿千米/时——光速的99.5%,“加把劲儿”,加到99.9%的光速,然后,“真正再加把劲儿”,让它突破光速的壁垒。爱因斯坦的公式说明这样的努力是永远不会成功的。物体运动越快,它的能量越大;而根据爱因斯坦的公式我们看到,物体能量越多,它的质量越大。例如,μ子以99.9%的光速运动时,要比它静止的伙伴重得多——严格说,大约重22倍(表1.1所列的是静态粒子质量)。而物体质量越大时,把它加速就越困难。把小孩儿搭上自行车很容易,推动一辆大卡车可就是另一回事儿了。所以,当μ子越来越快时,越不容易提高它的速度。当速度为99.999%光速时,μ子的质量增加到它原来的224倍;在99.99999999%的光速时,它的质量比原来大70000多倍。在速度逼近光速的过程中,质量的增加是没有极限的,因此需要无限的能量才可能使它达到或超过光速壁垒。这当然是不可能的,所以绝对不会有什么东西能比光还跑得快。
在下一章,我们会看到,这个结论也是物理学过去百年面对的第二个大冲突的根源,并最终使另一个曾令人仰慕和喜爱的理论走向死亡——那就是牛顿的万有引力理论。
第3章 卷曲与波澜
爱因斯坦通过狭义相对论解决了关于运动的“古老的直觉”与光速不变性之间的矛盾。简单地说,我们的直觉错了——因为我们寻常的运动跟光相比太慢了,而缓慢的运动遮掩了空间和时间的真实特性。狭义相对论揭开了它们的本性,说明它们大不同于我们从前的观念。然而,修正我们对空间和时间基础的认识却不是那么轻松的事情。爱因斯坦很快就意识到,狭义相对论引发了一连串的反应,其中有一点是特别剧烈的:万物以光速为极限的概念与牛顿在17世纪后期提出的可敬的引力理论是不相容的。于是,狭义相对论在解决一个矛盾的同时,又引出另一个矛盾。经过10年艰辛甚至痛苦的研究,爱因斯坦带着他的广义相对论走出了困境。在这个理论中,爱因斯坦又一次革新了我们的空间和时间观念,他证明它们是卷曲着的,而引力就是那卷曲的波澜。
牛顿的引力论
牛顿(Isaac Newton)1642年生在英国林肯郡。他把数学的全部力量带给了物理学的追求,改变了科学研究的面貌。他是不朽的智者,当问题需要新的数学时,他就自己把它创造出来。约3个世纪过去后,我们才看到另一个跟他一样的科学天才。牛顿关于宇宙的行为有数不清的发现,我们在这儿关心的是他的万有引力理论。引力作用充满了我们的日常生活。它让我们和我们周围的事物安稳地站在地球的表面;它不让我们呼吸的空气逃向外层空间;它使月亮围绕着地球,把地球约束在围绕着太阳的轨道上。从小行星、行星,到恒星和星系,亿万个宇宙的精灵在永不停歇地舞蹈,引力在指挥着这台宇宙大戏的旋律。300多年来,牛顿的影响使我们理所当然地认为,这唯一的引力是天地间万物发生的根源。但在牛顿以前,没人知道从树上落下的苹果会跟围绕着太阳旋转的行星有着相同的物理学原理。牛顿大胆地迈出一步,统一了主宰天与地的物理学,指出引力是在天地间活动着的一只看不见的手。
牛顿的引力思想大概可以说是一种伟大的平均论。他认为,每一样东西绝对有一个作用于其他任何东西的引力;不论事物的物理组成如何,它总能吸引别的事物,也被别的事物所吸引。经过对开普勒(Johannes Kepler)行星运动分析的仔细研究,牛顿得到,两个物体间的引力大小仅仅依赖于两个因素:组成每个物体的物质总量和物体间的距离。所谓“物质总量”指的是构成物质的质子、中子和电子总数,它决定着物体的质量。牛顿的万有引力理论断言,物体质量越大,两个物体间的引力越大;物体质量越小,引力越小;而且,物体间距离越小,引力越大;距离越大,引力越小。
牛顿不仅定性描述了引力,还写出了定量的方程。用语言来说,方程的意思是,两个物体间的引力正比于物体质量的乘积,反比于物体间距离的平方。这个“引力定律”可以用来预言行星和彗星围绕太阳的运动,月亮绕地球的运动,火箭在太空的运动;它还更多地用来描写地球上的运动,如篮球在空气中飞行,跳水队员从跳板上旋转着跳入水池。公式预言的与实际看到的这些事物的运动惊人的一致。直到20世纪初,这些成功一直是牛顿理论不容辩驳的支柱。然而,爱因斯坦的狭义相对论却给牛顿理论带来一个难以逾越的巨大障碍。
牛顿引力与狭义相对论不相容
狭义相对论的一个重要特征是光所限定的绝对速度。这个极限速度不仅适用于有形的物体,也适用于信号和各种形式的影响作用,认识这一点是很重要的。信息或者干扰从一个地方传到另一个地方,都不可能比光速更快。当然,比光慢的传播方式在世界上是很多的。例如,说话或者别的什么声音,是由振动以1100千米/时的速度在空气中传播的,这与10.8亿千米/时的光速相比确实微不足道。这两种速度的差别,在我们远离本垒观看棒球比赛时会变得很明显。当击球手击中球时,我们会先看到球被击中,然后才听到击球的声音。类似的现象发生在雷雨时。虽然闪电和雷鸣是同时发生的,但我们总是先看到闪电,后听到雷鸣。这同样反映的是光速与声速的巨大差别。狭义相对论的成功使我们知道,相反的情况——某个信号比光先到达我们——是不可能发生的。没有东西能比光更快。
问题是这样的:在牛顿引力理论中,一个物体作用在另一个物体上的引力完全取决于两个物体的质量和分开的距离,而与它们相互作用的时间无关。就是说,如果物体的质量和距离变了,则照牛顿的观点,物体将同时感觉它们之间的引力也变了。例如,牛顿理论认为,假如太阳突然爆炸了,那么1.5亿千米外的地球会立刻脱离它寻常的椭圆轨道。即使光从爆炸的太阳传到地球需要8分钟的时间,在牛顿理论中,太阳发生爆炸的消息却因为引力的突然改变而瞬间传到地球。
这个结论是直接与狭义相对论矛盾的,因为后者确信没有什么信息能比光的传播更快——瞬时传播大大地违反了相对论原理。
这样,爱因斯坦在20世纪初发现,成功的牛顿引力理论是与他的狭义相对论相矛盾的。他相信狭义相对论是正确的,尽管有数不清的实验支持牛顿理论,他还是去寻找一种能与狭义相对论相容的引力理论。终于,他发现了广义相对论。在那个理论里,空间和时间的性质又一次经历了惊人的变革。
爱因斯坦最快乐的思想
即使在狭义相对论出现之前,牛顿的引力理论也存在一个严重的缺陷。它能高度精确地预言物体如何在引力作用下运动,却没能说明引力是什么。就是说,在物理上彼此分离(甚至分离亿万千米)的物体,凭什么相互影响呢?引力是以什么方式发生作用的?这个问题牛顿本人当然也很清楚。照他自己的话讲:
显然,牛顿接受了引力存在的事实,然后建立了精确描述它的作用的方程,但是没能发现它是如何产生的。他为世界写了一本引力的“用户手册”,告诉人们如何“使用”它——遵照那些指令,物理学家、天文学家和工程师们成功地把火箭送到了月球、火星和太阳系的其他行星;预言了日食和月食;预言了彗星的运动,等等。但是,他留下了一个大大的谜——一个引力作用的“黑箱”,不知道那里面发生着什么。当我们玩CD机和个人电脑时,也处在类似的情形,我们不知道它们的内部是怎么工作的。我们只需要知道怎么用,不必知道它们怎么完成我们要它们做的事情。但是,一旦机器坏了,修理它就得靠内部运行的知识了。同样,爱因斯坦发现,虽然经过了200多年的实验证明,但狭义相对论表明,牛顿理论出现了某种难以捉摸的“破裂”,要修补它,需要完全把握引力的真正本性。
1907年的某一天,爱因斯坦坐在瑞士伯尔尼专利局办公室的桌旁,想着引力的问题。忽然,他抓住了关键的一点——经过曲折坎坷的思想历程,这一点终于把他引向一个崭新的引力理论,不仅弥合了牛顿引力的缺陷,而且彻底重构了引力的思维形式,而更重要的是,那形式是与狭义相对论完全一致的。
爱因斯坦那时想到的问题,与我们在第2章困惑过的问题有关。我们在那里强调的是,在观察者相对匀速运动的情况下,世界该是什么样子。仔细比较观察者们所看到的现象,我们发现背后藏着惊人的关于空间和时间本性的东西。但是,如果观察者是在加速运动呢?这种情况下,每个观察者看到的比泰然的匀速观察者要复杂得多,不过我们还是可以问一问,有没有什么办法来简化复杂,并将加速运动堂堂正正地带入我们新发现的空间和时间的概念?
爱因斯坦“最快乐的思想”就是那样一种简化问题的方法。为了理解他的思想,让我们走进2050年的一个故事。一天,你突然接到一个紧急电话,在华盛顿特区中心发现一颗像精心安置的炸弹模样的东西,要你去检查(你是联邦调查局首席爆破专家)。你急忙赶到现场一看,果然证实了你的忧虑:那是颗核弹,威力巨大,即使埋在海底或者地壳下面,它的爆炸也会带来毁灭性的灾难。你小心翼翼地检查了它的引爆机制,没办法消除;你还发现,它像一个奇巧的饵雷,随便碰不得。炸弹装在一个刻度盘上,当盘上的数字偏离现在一半时,炸弹就爆炸。根据它的计时方式,你知道自己只有一个星期多一点儿的时间了。几百万人的命运落在你的肩上——怎么办?
看来,它在地球上的任何一个地方爆炸都是不安全的,你只有一个选择:把它送到遥远的太空去,在那儿爆炸应该不会带来什么破坏。在联邦调查局(FBI)的专案组会上,你提出这个想法,但立刻遭到了一位年轻助手的反对。“您的计划存在严重问题,”年轻的伊萨克(Isaac)告诉你,“当炸弹远离地球时,它的重量会减轻,因为地球对它的吸引力消失了。这意味着装置上刻度盘的读数会减小,炸弹还没到安全的高度就会爆炸。”你还没来得及考虑他的意见,另一位年轻助手阿尔伯特(Albert)又站起来:“其实,细想想,还有更严重的问题,”他说,“这个问题跟伊萨克的一样重要,也许更难捉摸,请耐心听我解释一下。”你想叫阿尔伯特停下来让自己好好想想伊萨克的意见,可他总是一开口就没人堵得住。
“要把炸弹送上太空,我们只有将它绑在火箭上。火箭向上加速时,刻度盘上的读数会增大,一样会使炸弹先爆炸。原因是这样的:炸弹的基座——在那个刻度盘上,在加速的时候会比静止时更强烈地压迫它,就像坐在加速的汽车上我们的身体会向后挤压坐垫一样。炸弹‘挤压’刻度盘,就像我们挤压汽车坐垫。刻度盘受到挤压,当然会增大读数——只要偏离超过50%,它就将引爆炸弹。”
感谢阿尔伯特的解释。但是,你没有听他的话,你宁肯信伊萨克的。你沮丧地说,否定一个思想,只需要致命的一击就够了,伊萨克的意见显然是对的,确实否决了那个想法。你感觉有点儿绝望了,问大家还有没有新的建议。这时,阿尔伯特有一个漂亮想法。“关于第二点,”他接着说,“我想您的看法还没有完全绝望。伊萨克说的,炸弹装置升入太空时,地球引力会消失,就是说,刻度盘的读数会减小。而在我看来,火箭向上的加速度会使炸弹挤压刻度盘,就是说,盘的读数会增大。两种观点放在一起,我们发现,如果在每一时刻精确调整火箭向上的加速度,两种效应就会彼此抵消!具体说,在升空的初始阶段,火箭还能完全感觉地球的引力,这时候加速度可以不那么大,我们还能在那50%的空隙里。火箭离地球越来越远,感觉的引力越来越小,这时候我们需要增大加速度来克服引力的不足。因为上升加速度导致的读数增加,与引力消失导致的读数减小,可以完全抵消,这样,我们实际上能保证刻度盘上的读数一点儿也不改变!”
你慢慢发现阿尔伯特的建议有点儿意思。“换句话讲,”你回答说,“向上的加速度可以替代引力。我们能以适当的加速运动来模拟引力效应。”
“完全正确。”阿尔伯特回答。
“那么,”你接着说,“我们可以把核弹弄到太空去,通过精心调节火箭加速度,还可以确保刻度盘上的读数不会改变。这样,在地球的安全距离以内就不会发生爆炸了。”于是,你可以利用21世纪的火箭技术来协调引力和加速运动,从而避免一场灾难。
引力与加速运动密切关联着,正是爱因斯坦在一个快乐的日子在伯尔尼专利局的办公室里想到的最关键的一点。虽然核弹历险说明了这一思想的基本特征,但我们还是应该用接近第2章的方法再把它重复一遍。先回想一下,在封闭的没有窗户、没有加速的列车车厢里,我们无法确定自己的速度。不论速度多大,车厢看起来都是一样的,在车厢里做的实验也得出同样结果。从更基本的意义说,如果没有外面的路标做参考,我们不能以速度来定义某个运动状态。另一方面,如果列车是加速运动的,即使在封闭的车厢里,我们也能感觉到有力作用在身体上。例如,你坐在加速的列车上,面对着前进方向,你会感觉座椅有股力量作用在背上,跟阿尔伯特讲的汽车的情形一样。同样,假如列车向上加速,你会感到地板作用在脚上的力量。爱因斯坦发现,在小小的车厢里,我们不能区别加速的情形与没有加速而有引力的情形:如果大小调节适当,来自引力场的力与来自加速运动的力是不可能区分的。假如车厢静静地停在地面上,我们的脚下会感受那熟悉的来自地板的力,就仿佛车厢在向上加速;阿尔伯特在探索如何把恐怖的核弹送进太空时,考虑的也是这种等效性。假如车厢向后倒下来停在地上,我们的后背会感觉座椅的力量(使我们不致落下),与列车水平向前加速时的感觉一样。爱因斯坦将加速运动与引力的不可分辨的性质称作等效原理。它在广义相对论里起着核心的作用。[1]
我们将看到,从狭义相对论开始的工作,由广义相对论完成了。狭义相对论通过相对性原理确立了不同观察者的观点都是平等的;物理学定律对一切匀速运动的观察者都是一样的。但这是有限的平等,它排除了数不清的其他观点——那些加速运动者的观点。现在,爱因斯坦在1907年的发现告诉我们如何将所有的观点——匀速的和加速的——纳入一个平等的构架。在加速的无引力场的观点与非加速的有引力场的观点之间不存在任何差别,所以我们可以借后一个观点说,所有的观察者,不论运动状态如何,都可以认为自己是静止的而“世界的其他事物在他们身边运动”,不过,在他们周围出现了某个引力场。在这个意义上,广义相对论通过引力保证所有可能的观察者的观点都一样站得住脚。(以后我们会看到,第2章讲的因为加速运动而出现的两个人之间的区别——在乔治打开喷气包追赶格蕾茜时,会变得比她年轻——也可以不用加速度而用引力来说明。)
引力与加速运动的这种深层联系当然是惊人的发现,但爱因斯坦为什么为它感到快乐呢?简单地说,引力太神秘了,尽管充满了无边的宇宙,却令人难以捉摸。另一方面,加速运动虽然比匀速运动复杂一些,却是具体而实际的。爱因斯坦发现了两者的基本联系,意识到他可以靠对运动的认识去获得对引力的理解。即使凭爱因斯坦的天才,实现这个计划也不是那么容易的。不过,这个方法最终还是结出了广义相对论的硕果。为了那个目标,爱因斯坦还建立了统一引力与加速运动的第二种联系:空间和时间的弯曲。现在我们就来看它。
加速度与时空弯曲
引力问题几乎令爱因斯坦着魔了。在伯尔尼专利局办公室冒出那个“快乐的思想”大约5年以后,他写信告诉物理学家A.索末菲(Arnold Sommerfeld),“我现在完全被引力问题占有了……有一点是肯定的——我生来还从未有过什么事情这样困扰着我……与这个问题相比,原先的(狭义)相对论不过是一场儿戏。”[12]
1912年,他又迈出了关键的一步。他用狭义相对论来联结引力和加速运动,得到一个虽然简单却很微妙的结果。为跟上他的论证,最简单的办法是像他做的那样,考虑一种特殊的加速运动。[13]回想一下,物体的加速指的是要么改变速度大小,要么改变运动方向。为简单起见,我们考虑只改变物体运动方向而速度大小保持固定的加速运动。特别地,我们考虑圆周上的运动,这种运动可以在游乐园的“龙卷风”转盘上亲身体验。假如你害怕自己的身体受不了那样的折腾,紧紧地背靠着高速飞旋的玻璃纤维环的内壁,你会像经历别的加速运动一样,觉得自己像要被径向地抛出去,而环壁在紧紧地顶着你的背,你在圆环上一点儿也动不了。(其实,高速的旋转会把你牢牢地“钉”在玻璃纤维的环上,即使脚下空了,你也不会滑落下去。当然,那跟这儿的讨论无关。)假如环非常光滑,你闭上眼睛,几乎会感觉自己正躺在床上——环壁对你背的压力就像床在支撑着你。我们说“几乎”,是因为你还能感觉到寻常的“向下”的重力,头还没有完全“转晕”。不过,如果那转环是在太空,还是转那么快,你真会感觉自己是躺在家里的床上。另外,假如你想“起床”来沿着玻璃纤维的环散散步,你会感觉双脚仿佛踏在家里的地板上。实际上,太空站就是设计成这样旋转的,让你能在太空中感觉“故乡”的引力。
我们跟着爱因斯坦用旋转的环的加速度来模拟引力,现在可以来看环里的人所感觉的空间和时间是什么样的。以我们的例子来说,爱因斯坦的论证是这样的:我们静止的观察者很容易测量转环的周长和半径。例如,为了测周长,我们可以仔细地贴着转环用尺子一步一步地量;为测半径,我们可以用同样的办法,将尺子从转轴那一点一节节摆到环的边缘。我们发现,周长与半径之比是π的2倍,约6.28——与画在纸上的任何圆圈一样,这是我们在中学几何里学过的。但是,在转环上的人会看到什么样的情形呢?
还是让斯里姆和吉姆来告诉我们吧。这会儿,兄弟俩正在转环上玩儿呢。我们请两人各拿一把尺子,斯里姆测量周长,吉姆测量半径。为看得更清楚些,我们来鸟瞰一下那个转环,如图3.1。在图中我们画了一个箭头,说明在那个时刻各点的运动方向。当斯里姆开始测量周长时,我们从旁发现他将得到不同的结果。他把尺子贴着环一节节测量时,我们会看到尺子缩短了,这不过是第2章讨论过的洛伦兹收缩,即物体的长度沿运动方向缩短。既然尺子缩短了,他必须多测量几步才能测完整个周长。而他自己还以为尺子仍然是30厘米(因为斯里姆与尺子间没有相对运动,所以他觉得尺子的长度跟平常一样),所以他测得的周长比我们测的更长。(如果你觉得奇怪,可以看看后面的注释。[2])
图3.1 斯里姆的尺子沿着转环运动的方向,长度缩短了。吉姆的尺子在径向支架上,与运动方向垂直,所以长度没有缩短
那么,半径呢?当然,吉姆也是用尺子一节节去测量转环的径向支架的长度,从我们的眼睛看,他测的长度跟我们相同。原因是,他的尺子并没有(像测量周长那样)指向每一瞬间的旋转方向。实际上,尺子是垂直于运动方向的,所以不会发生长度的收缩。于是,吉姆得到的径向长度跟我们是完全一样的。
但是,当斯里姆和吉姆计算周长与半径之比时,他们会得到一个比我们的2π更大的数,因为这时的周长大了,而半径是一样的。这可真是奇怪。一个圆的东西,怎么可能违反古老的法则呢——对每个圆来说,那个比值不都应该是2π吗?
爱因斯坦是这样解释的:古希腊发现的那个法则只对平面上的圆才成立。我们知道游乐园里哈哈镜凹凸的镜面会扭曲人的面目,同样,如果把圆画在卷曲的面上,寻常的空间关系也会被扭曲:周长与半径之比往往不等于2π。
图3.2 球面上的圆(b)的周长比平面上(a)的更短,而马鞍面上的圆(c)的周长更长,尽管三个圆的半径是一样的
我们来比较一下图3.2中的三个半径相同的圆。注意,它们的周长是不同的。图3.2(b)画在球面上的圆的周长比图3.2(a)画在平面上的圆的周长小,尽管它们的半径是一样的。弯曲的球面使圆的径向直线慢慢聚合,结果周长变短了。在图3.2(c)中,圆仍然画在曲面上——在马鞍面上,但它的周长却比平面的圆长;马鞍形的弯曲特点是使圆的径向直线慢慢散开,从而使周长增大了。这些事实意味着,周长与半径之比,在图3.2(b)小于2π,在图3.2(a)等于2π,而在图3.2(c)大于2π。比值与2π的偏离,特别是图3.2(c)的情形,正是我们在转环的例子中看到的。根据这个发现,爱因斯坦提出空间弯曲的概念,以解释为什么“正常的”欧几里得几何被破坏了。千百年来人们在儿童时代学习的古希腊人的平面几何,根本不适用于转环上的人,我们需要用图3.2(c)示意的那种更一般的弯曲空间的几何来代替它。[3]
就这样,爱因斯坦认识到,我们熟悉的被古希腊人奉为法则的空间几何关系——那些与平直的空间图像(如桌面上的圆)相伴的关系,在加速运动的观察者眼里是不成立的。当然,我们只讨论了一种特殊的加速运动;但爱因斯坦证明了,在所有加速运动的情形中,空间都是弯曲的。
实际上,加速运动不光导致空间弯曲,也导致类似的时间弯曲。(历史上,爱因斯坦先关注的是时间弯曲,然后才发现空间弯曲的重要性。[3])坦白说,我们并不奇怪时间也会弯曲,因为我们已经在第2章看到狭义相对论明确地把空间和时间统一起来了。这种统一,闵可夫斯基曾在1908年的一次演讲中以诗一般的语言作了概括:“从今往后,空间也好,时间也好,都将躲进阴影,只有两者的某种统一才能独立地存在。”[14]用更普通(不过也很不精确)的话来说,狭义相对论将空间和时间编织到一个统一的时空结构里,向我们宣布“凡对空间正确的,对时间也正确”。但问题跟着来了:弯曲的空间可以用卷曲的图形来表现,那弯曲的时间是什么呢?
为回答这个问题,我们还是把它交给转环上的斯里姆和吉姆,请他们做一个实验。斯里姆背靠着环站在径向支架的一端,吉姆从旋转轴心沿着支架慢慢向他爬过去。吉姆每爬几步就停下来,与斯里姆对一下表。他们发现了什么呢?从我们静止的旁观者看,还是那个结论:两人的表不同步。这个结果的原因在于,我们看到斯里姆和吉姆在以不同的速度运动——在转环上,离轴心越远,转过的距离越长,因此旋转的速度越快。但根据狭义相对论,你动得越快,你的表走得越慢。于是,我们发现斯里姆的表比吉姆的慢。而且,两人还会发现,在吉姆爬向斯里姆的过程中,他的表越走越慢,越来越接近斯里姆的表。这反映了一个事实:当吉姆在支架上越爬越远,他的旋转速度越来越接近斯里姆。
我们的结论是,对于转环上的观察者(如斯里姆和吉姆)来说,时间的速度依赖于各人的确切位置——在这里,即他们离中心的距离。这说明了我们讲的弯曲时间:假如时间在不同的位置上有不同的速度,我们就说时间是弯曲的。对我们现在的讨论,还有特别重要的一点,吉姆在向外爬的时候会注意到另一件事情。他将感觉一股强大的力量把他向外推,因为他离中心越远,不但速度增加了,加速度也大了。于是,我们看到,在旋转的环上,大的加速度是与缓慢的钟联系在一起的——就是说,加速度越大,时间弯曲越强烈。
爱因斯坦靠这些发现迈出了最后一步。他已经证明了引力与加速运动在现象上是不可分辨的,现在他又发现加速运动联系着空间和时间的弯曲,接下来他揭开了引力“黑箱”的秘密——引力是以什么机制发生作用的。据爱因斯坦的观点,引力就是空间和时间的弯曲。这是什么意思呢?
广义相对论基础
为理解这种新的引力观,我们考虑实际的行星绕恒星运动的情形,例如,地球绕太阳运行的情形。在牛顿的引力论里,太阳把地球限制在轨道上,靠的是一根“看不见的绳子”,那根引力的“绳子”仿佛从太阳生出来,瞬间穿过遥远的空间距离,把地球套住(当然,地球也同样一下子抓住了太阳)。实际发生了什么,爱因斯坦提出了新的概念。为了讨论爱因斯坦的方法,我们最好能有一个容易把握的具体形象的模型。那样可以从两个方面将问题简化。第一,我们先不管时间,只关心空间的视觉模型,然后再把时间包括进来讨论。第二,为了让图像能在纸上表现出来,我们将经常用二维的类比来替代三维的空间。从考虑这样的低维模型得到的大多数结果,都可以直接用于三维的物理空间。因此,简单的模型是有力的思维方式。
在图3.3中,我们运用了这种简化方式,把我们宇宙的空间画成一个二维的区域。图中的网格不过用来确定位置,就像我们以街道网来确定城市里的位置一样。当然,我们说城市的某个地址,往往要确定它在二维街道网上的位置,还要说明它在竖直方向上的位置,例如在几楼几号。为了让图像更简洁,我们在二维类比的图中压缩了第3个空间方向上的东西。
图3.3 平直空间示意图
爱因斯坦猜想,当没有任何物质或能量存在时,空间应该是平直的。用二维模型来说,空间的“形状”应该像一张光滑的桌面,如图3.3。这也是几千年来人们普遍怀有的我们宇宙的空间图像。那么,假如空间出现一个大质量物体(如太阳),会发生什么事情呢?在爱因斯坦之前,人们会说,什么也不会发生,他们认为,空间(和时间)不过是一个死的剧场,为宇宙提供一个表现自己的舞台。但是,跟着爱因斯坦的思路,我们将走向一个不同的结论。
像太阳那样的大质量物体(实际上,任何物体)对其他物体都有引力作用。在那个可怕的“核弹事件”里,我们知道了引力与加速运动是不可分辨的。在转环游戏里,我们知道描写加速运动需要弯曲空间的关系。引力、加速运动与弯曲空间的联系启发爱因斯坦提出一个惊人的观点:物质(如太阳)的存在导致它周围的空间结构发生弯曲,如图3.4。这是我们常看到的一幅图,像一张橡皮膜上放一只保龄球,空间结构因大质量物体的存在而发生扭曲。照这个不同寻常的看法,空间不再仅仅是被动的宇宙活动的舞台;空间的形状倒是环境事物的反映。
图3.4 大质量物体使空间结构发生弯曲,就像一只保龄球放在橡皮膜上
另一方面,当太阳附近的物体经过空间扭曲的结构时,扭曲的空间也会影响它们的运动。用保龄球和橡皮膜的类比来讲,假如我们以一定的初始速度在膜上放一粒小滚珠,则它滚动的路线依赖于膜中间有没有球。如果没有球,膜还是平坦的,小珠子会沿一条直线滚过去。如果有球,膜被扭曲了,小珠子将沿着曲线滚动。实际上,如果忽略摩擦,我们可以让小珠子以适当的速度和方向滚动,它可以沿一条回归的曲线绕着中间的球滚动——就是说,“它滚进了轨道”。显然,这个例子可以用来说明引力。
太阳就像那只保龄球,它使周围的空间结构发生弯曲,地球就像那颗滚珠,被弯曲了的空间卷入它的轨道。只要速度的大小和方向适当,地球也会像滚珠那样绕着太阳转动。地球运动所受的这种影响,就是我们通常所说的太阳对地球的引力作用,如图3.5。现在我们看到,爱因斯坦不同于牛顿的是,他确定了引力传播的机制:空间的弯曲。在爱因斯坦看来,把地球“绑”在轨道上的“引力绳”,并不是太阳的神秘的瞬间作用,而是因为太阳的存在所导致的空间的弯曲。
图3.5 地球在绕着太阳的轨道上运行,是因为地球滚入了弯曲空间的一道“沟谷”。更准确地说,它走的是在太阳周围弯曲区域里“阻力最小”的路线
这幅图景帮助我们以新的方法认识了引力的两个基本特征。第一,在爱因斯坦的引力图像中,物体质量越大,所导致的空间扭曲越强,就像保龄球越大,橡皮膜的扭曲也越大。这意味着物体质量越大,它能作用于其他物体的引力就越大,这跟我们的经验是一致的。第二,距保龄球越远的地方,那里的膜的变形越小;同样,距大质量物体越远,空间的弯曲越弱。这也是我们熟悉的引力特性:物体相距越远,引力作用越小。
还有一点很重要,那就是小滚珠也会使橡皮膜弯曲,尽管那弯曲很小。同样,地球作为一个有质量的物体,当然也能使空间结构发生弯曲,不过比太阳的小得多。用广义相对论的话讲,地球就是这样带着月亮在轨道上运行的,我们也是因为这一点才能站在大地上。当跳伞者从天空落下时,他是在沿着地球质量产生的弯曲的空间结构向下滑行。另外,我们每一个人也跟其他有质量的物体一样,能使我们身体近旁的空间结构发生弯曲。当然,我们小小的身体只能引起一点小小的波动。
总的说来,爱因斯坦完全同意牛顿说的“引力必然有一个动因”,而且响应了牛顿的挑战,考虑了他“留给我的读者去考虑”的问题。根据爱因斯坦的理论,引力的动因是宇宙的结构。
几个缺点
橡皮膜与保龄球的例子,让我们具体形象地把握了我们所说的宇宙空间结构的弯曲是什么意思。物理学家常用类似的比喻来帮助自己更直观地认识引力和弯曲。然而,尽管这办法很有用,但膜与球的类比还是不够完美,为把问题讲清楚,我们来看它有哪些缺点。
第一,当太阳使它周围的空间发生弯曲时,并不像保龄球那样是因为它被引力“拉下来的”;在保龄球的例子中,是因为地球的引力作用才使膜发生弯曲的。对太阳来说,没有别的什么东西在“拉它”。相反,爱因斯坦告诉我们,空间的弯曲才是引力。只要有物质的存在,空间就会发生弯曲。同样,地球也不像弯曲膜上的那颗小滚珠,它在轨道上运行并不是因为有什么别的外来的东西把它引入弯曲空间里的沟谷。事实上,爱因斯坦证明,物体在空间(准确说是时空)的运动总沿着可能的最短路线——“可能的最容易的路线”或“阻力最小的路线”。如果空间是弯曲的,这样的路线也会弯曲。所以,球与膜的类比尽管让我们直观看到了大质量物体(如太阳)如何扭曲空间,又如何影响其他物体(如地球)的运动,但空间扭曲的物理学机制却完全不是那样的。球与膜的模型所依据的是我们在传统的牛顿框架内对引力的直观认识,而弯曲空间的却是爱因斯坦重构的引力框架。
球与膜类比的第二个缺点在于橡皮膜是二维的。实际情况是,太阳(以及一切有质量的物体)扭曲了它周围的三维空间,当然这是很难用图像来表达的。图3.6试着表现了一下。太阳周围的所有空间——它的“下面”“旁边”和“上头”——都经历了相同性质的扭曲变形,图3.6只画出了一部分。物体(如地球)就在这样的弯曲的空间环境里穿行。也许有人觉得奇怪——地球为什么不会闯入图中的那道“墙”呢?可是别忘了,空间不像橡皮膜,不是摸得着的壁垒。图中的弯曲网格不过是从弯曲的三维空间里剪下来的两张薄片,而你、我、地球以及其他万事万物一样,都浸没在那个三维空间里,在其中自由地活动。也许你会觉得这把问题说得更令人困惑了:如果我们真的浸没在空间的结构里,为什么没有感到它的存在呢?其实,我们感觉到了。我们感觉到了引力,而空间正是引力发生作用的中介。大物理学家惠勒(J.Wheeler)常常这样描述引力:“质量牵着空间,告诉空间如何弯曲;空间牵着质量,告诉质量如何运动。”[15]
图3.6 太阳周围三维空间的弯曲
类比的第三个缺点是我们把时间维压缩了。这样做原是为了使图像更清晰;尽管狭义相对论明确指出我们应该像3个空间维那样来思考时间维,但时间却总是难得“看见的”。不过,转环的经历说明,加速度既弯曲了空间,也弯曲了时间,引力当然也该如此。(实际上,广义相对论的数学证明,在像地球围绕太阳运行的这种相对缓慢的运动中,时间的弯曲对地球运动的影响要远远小于空间的弯曲。)下一节过后,我们还会回来讨论时间的弯曲。
上面讲的三个缺点是很严重的,但是只要我们在心里把握了它们,球与膜所表现的弯曲空间的图景还是可以借来很形象地概括爱因斯坦的新引力观。
矛盾解决了
爱因斯坦描绘了一个清晰的引力作用图景,空间和时间在那里也成了动力学的参与者。不过,关键的问题是,这个新建的引力理论的框架能不能解决困扰着牛顿引力理论与狭义相对论的矛盾?回答是,它真解决了这个矛盾。我们还是借膜的类比来说明基本的思想。我们想象,在没有保龄球的时候,有一颗珠子沿着平坦的膜上的一条直线滚动。当我们把球放上膜时,小珠子的运动会受影响,但那不会在瞬间发生。如果把这过程拍摄下来,看它的慢动作,我们会看到,保龄球引起的扰动像水池里的波纹一样向周围扩散开去,然后到达滚珠的位置。不久,膜面的波动平息下来,我们看见一张静止的弯曲了的膜。
空间结构也是这样的。没有质量存在时,空间是平直的,小质量物体可以安然地静止其间或者匀速地运动。当大质量物体出现时,空间会弯曲——但像膜一样,不会瞬间地扭曲;扰动从大物体开始,然后向外扩张,最后形成弯曲的空间结构,传达那个庞然大物的引力作用。在我们的类比中,扰动在膜面上向外的扩张速度由膜的组成材料决定。在广义相对论的情形中,爱因斯坦可以计算宇宙空间结构的扰动以多大速度传播,他发现那正好是光速。我们在前面曾讨论过一个假想的例子,太阳熄灭了,通过引力的改变影响地球——现在我们知道,那影响不会瞬间传到地球。实际上,当物体改变位置,甚至被风吹动时,都会使时空结构的扭曲形态产生扰动,扰动以光速向外扩张,这满足了狭义相对论以光速为宇宙极限速度的要求。所以,在太阳爆炸8分钟以后,地球上的我们才知道太阳熄灭了,而在这同一时刻我们也感到太阳的引力消失了。爱因斯坦的新理论就这样解决了矛盾;引力扰动与光同步,却总也超不过它。
再谈时间弯曲
图3.2、图3.4和图3.6基本上让我们看到了什么是“弯曲的空间”,那就是空间形态被扭曲了。物理学家曾用类似的图像来表现“弯曲的时间”,但那太难说明白了,所以我们不画那些图。我们还是学斯里姆和吉姆坐转环的例子来体验引力产生的时间弯曲。
为此,我们再来看看格蕾茜和乔治。这回他们不在漆黑的太空,而是飘浮在太阳系的边缘。他们的太空服上还戴着巨大的数字钟,是原来校准好了的。为简单起见,我们忽略行星的影响,只考虑太阳引力场的作用。在乔治和格蕾茜附近泊着一艘飞船,从飞船放下一根长线,伸向太阳的表面。乔治顺着那线慢慢接近太阳。每过一定的时间,他就停下来,与格蕾茜比较他们的钟走过的时间。广义相对论的时间弯曲的预言说明,乔治的钟将比格蕾茜的钟越走越慢,因为他经历的引力场越来越强。就是说,他离太阳越近,他的钟走得越慢。从这个意义说,引力像扭曲空间那样也扭曲了时间。
应该看到,这里的情形与第2章不同。在那里,乔治和格蕾茜是在虚空里以不变的速度相对运动着,而现在两人不再有那样的对称地位。与格蕾茜不同的是,乔治感到引力在越变越强——他离太阳越近,就得费更大的气力抓紧那根线才不会被太阳的引力拉下去。在格蕾茜看来,乔治的钟慢了;乔治自己也同意他的钟慢了。在这里,两个角色的地位是不“平等的”,也就不会有以前遇到过的相反的结论。事实上,这正是第2章里乔治打开喷气袋去追赶格蕾茜所发生的事情。乔治的加速度使他的钟走得肯定比格蕾茜的慢。我们现在知道,经历加速运动与感觉引力作用是一回事,乔治现在的情形也满足这个原理,所以我们看到,他的钟和发生在他生命里的一切,都比格蕾茜的慢。
在一颗普通恒星(如太阳)的表面,引力场对时间的影响是很小的。例如,让格蕾茜停在离太阳10亿千米以外,而乔治下到离太阳表面几千米的地方,他的钟的节律大约为格蕾茜的99.9998%,的确慢了,但慢得不多。[4]但是,假如乔治顺着长线爬到一颗中子星的表面,他的钟的节律将是格蕾茜的76%。虽然中子星质量与太阳差不多,但密度却是太阳的千万亿倍,所以它的引力场比太阳强得多。更强的引力场,如黑洞的外面(下面讨论),将使时间走得更慢;引力场越强,时间弯曲越严重。
广义相对论的实验验证
大多数研究广义相对论的人都会醉心于它的美妙。牛顿那冷冰冰的、机械的空间、时间和引力的概念,被爱因斯坦以一种动力学的、几何的弯曲的时空图景取代了,引力嵌入了宇宙的基本结构。在最基本的水平上,引力成为宇宙的主要部分,而不需添加多余的结构。空间和时间卷曲着、褶皱着、激波荡漾着,活生生地表现着我们所说的引力。
不管有多美,物理学理论最终还得靠它精确解释和预言物理学现象的能力来检验。牛顿的引力理论自17世纪末出现以来直到20世纪初,总是一路旌旗,经历了无数考验。不论是从斜塔落下的铁球、向太空飞去的火箭,还是在太阳身边往来的彗星,所有现象都能从牛顿理论得到非常精确的解释;牛顿理论提出的预言也在不同条件下得到了数不清的证实。我们说过,向这样一个在实验上无比成功的理论提出疑问,只是因为它那瞬时传递引力的性质与狭义相对论矛盾。
在我们生存的低速世界里,狭义相对论的效应是极端微弱的,尽管它们对认识空间、时间和运动起着关键作用。同样,与狭义相对论相容的广义相对论与牛顿引力理论的差别,在大多数普通情形中也都小得可怜。这是好事,也是坏事。好的方面在于,如果哪个理论想来取代牛顿的引力理论,它在牛顿理论经过检验的场合应该拿出更好的结果;不好的地方是,我们很难从实验判别哪个理论更好。区别牛顿理论与爱因斯坦理论需要极高的实验测量精度,而实验却敏感地依赖于两个理论是如何不同的。例如,扔出一个球,用牛顿和爱因斯坦的引力理论来预言球会落到什么地方,两家结果会不一样,但差别很小,超出了我们通常实验检验的能力。我们需要更精巧的实验,爱因斯坦曾经提出过一种。[5]
我们都是在晚上看星星,当然它们白天也在;但我们白天往往看不见,因为遥远微弱的星光总被太阳的光芒掩盖了。不过,日食的时候,月亮遮住了太阳,遥远的星星也看得见了。但太阳还是在发生影响。来自遥远恒星的光在到达地球的路上一定会从太阳近旁经过,爱因斯坦的广义相对论预言太阳使它周围的空间和时间发生弯曲,这弯曲将影响星光的路线。来自远方的光子在宇宙的结构里穿行,结构弯曲了,光子的运动当然也会受影响,这与有质量的物体没有什么不同。从太阳掠过的光信号在到达地球时,路线已经历了最大的偏转。日食使我们有机会看到那些没有被淹没的掠过太阳的星光。
光线偏转的角度可以简单测量。偏转的星光带来的错觉是,我们看到的恒星的位置移动了。将我们在日食时看到的恒星位置与半年前(或后)当地球在轨道另一端时我们在夜晚(没有太阳弯曲的影响)看到的恒星的实际位置相比较,就能准确测量位置偏移了多少。1915年11月,爱因斯坦用他的新引力观点计算了星光掠过太阳应该偏转的角度,结果是0.00049度(1.75弧秒,1弧秒等于1/3600度)。这个小小的角度与从3千米外看一枚硬币张开的角度一样。不过,那时的技术已经能够测量这么小的角度。1919年5月29日日食期间,在格林尼治天文台台长F.戴森爵士(Sir Frank Dyson)的激励下,英格兰皇家天文学会秘书、著名天文学家A.爱丁顿(Arthur Eddington)组织了一只考察队到西非海岸的普林西比岛去检验爱因斯坦的预言。
普林西比的日食照片[还有戴维森(Charles Davidson)和克罗梅林(Andrew Crommelin)率领的另一只英国考察队从巴西索布雷尔拍回的照片]经过5个月的分析后,1919年11月6日,皇家学会和皇家天文学会联合举行会议宣布,爱因斯坦基于广义相对论的预言得到了证实。从前的空间和时间概念被彻底推翻了——这个胜利的消息很快就超越了物理学的小圈子,爱因斯坦成了举世闻名的人物。在第二天的伦敦《泰晤士报》上,我们看到这样的大标题:“科学革命——宇宙新理论——牛顿理论大崩溃。”[16]这是爱因斯坦辉煌的一刻。
接下来的几年里,人们仔细审查了爱丁顿关于广义相对论的证据。测量中有许多困难和不确定的因素,很难对原来结果的可靠性提出什么疑问。不过,近40年来,利用新的技术进步进行的大量实验以极高的精度检验了广义相对论的诸多方面,所有预言都被证实了。人们不再怀疑,爱因斯坦的引力图像不但与狭义相对论相容,而且还提出了比牛顿理论更接近实验结果的预言。
黑洞、大爆炸和空间膨胀
狭义相对论在高速运动的情形下会显著地表现出来;广义相对论则在物体质量大、空间和时间相应地弯曲剧烈时发挥自己的作用。我们来看两个例子。
第一个例子是德国天文学家K.施瓦氏(Karl Schwarzschild)发现的。那是1916年第一次世界大战期间,他正在俄国前线,一面计算他的弹道曲线,一面学习爱因斯坦的引力新发现。令人惊讶的是,爱因斯坦完成广义相对论还没几个月,施瓦氏就用这个理论得到一幅完整而精确的图像,描绘了完全球状星体附近的空间和时间是如何弯曲的。他把结果从俄国前线寄给爱因斯坦,爱因斯坦代表他向普鲁士科学院做了报告。
施瓦氏的研究——我们现在知道的“施瓦氏解”——不仅从数学上证实并精确化了图3.5示意的空间弯曲,而且揭示了广义相对论的一个奇妙结果。他证明,假如星体质量聚集在一个足够小的球状区域,质量除以半径超过某个特别的临界值,那么时空将产生剧烈的卷曲,包括光在内的一切事物都将卷缩在星体附近,而不可能逃脱它的引力的掌握。因为连光都跑不出这种“压缩的星体”,所以它们起初叫黑星或冻星。更动听的名字是多年以后惠勒发明的,他称它们为黑洞——因为不发光,所以“黑”;因为靠近它们的任何东西都会落下去,一去不回,所以是“洞”。这个名字一直叫到今天。
图3.7 黑洞令周围时空结构发生严重卷曲,任何物体落进它的“事件视界”——图中的黑圆圈——都不可能逃脱它引力的掌握。没人完全知道黑洞最深处的一点在发生着什么
图3.7表现了施瓦氏的解。尽管黑洞很“贪婪”,但如果物体从“安全的”距离经过它时,也就像经过一颗普通的恒星一样;虽然有一定的偏转,但还能继续它的快乐旅行。但是,不论什么材料构成的物体,只要离黑洞太近——近到所谓黑洞的事件视界以内——它就完了;它将不可抗拒地被拉向黑洞的中心,去忍受那无限增大的最终毁灭一切的强大引力。假如你的脚先落进了事件视界,那么,当你向黑洞中心逼近时,你会感觉越来越难受。黑洞引力将大得吓人,作用在你脚上的力会比头上的大得多(因为脚先落进黑洞,它离中心比头更近一点儿);多大呢?它会把你拉长,然后把你的身体撕成碎片。
反过来看,假如你有先见之明,在黑洞附近游荡时万分小心,不敢越过视界半步,那么你可以借助黑洞去经历一次奇遇。例如,你找到了一个比太阳重1000倍的黑洞,想凭着一根长线,像乔治接近太阳那样爬到黑洞视界上面3厘米的地方。我们说过,引力场导致时间弯曲,这意味着时间经历会慢下来。实际上,因为黑洞的引力场太强了,所以你的时间经历不但会慢,简直要慢到家了。当你在地球上的朋友们的钟响过1万次时,你的钟可能才响1次。如果你这样在视界上飘浮1年,然后沿着长线向上爬回等着你的飞船,然后经过短暂而愉快的旅行回到地球的家。当你踏上地球,你会发现距你当初离开已经过了1万年!这样,黑洞成了某种时间机器,让你能走到地球遥远的未来。
现在我们具体来看有关的几个极端的数字。如果太阳质量的恒星成了黑洞,它的半径不会是现在的大小(约70万千米),而将不足3千米——想想看,那就是说可以把太阳拿到曼哈顿岛的一个角落。一小勺这样挤压过的太阳物质将和珠穆朗玛峰一样重。如果要把地球做成黑洞,就得把它挤压成一个半径不足2厘米的小球。多年来,物理学家一直在怀疑是不是真有这样极端的物质形态,很多人认为黑洞不过是疲惫的理论家们幻想的东西。
然而,近10年来,黑洞存在的实验证据越来越多,越来越令人信服。当然,因为洞是黑的,不可能直接用望远镜在天空搜寻。实际上,天文学家不是在找黑洞,而是找可能在黑洞事件视界外的正常发光恒星的反常行为。例如,当黑洞附近的普通恒星的外层尘埃和气体落向事件视界时,它们将加速到近光速。在这样的速度下,盘旋下落物质的内部摩擦将产生大量的热,令混合的尘埃云“发光”,向外发出可见光和X射线。因为这些辐射在视界外面,所以它们可以逃离黑洞,穿过空间,来到我们的实验室和望远镜。广义相对论预言了这些X射线所具有的各种性质。这些预言的性质的发现,为黑洞的存在提供了强有力的——尽管不是那么直接的——证据。例如,许多证据表明,在我们银河系的中心有一个巨大的黑洞,它的质量是太阳的250万倍。然而这样一个庞然大物也算不得什么,天文学家相信,在遍布宇宙的类星体(一种亮度惊人的遥远天体)的中心,可能藏着比太阳质量大10亿倍的黑洞。
施瓦氏在发现他那个解几个月后,就在俄国前线染上一种皮肤病死了,那年才42岁。虽然他与爱因斯坦的引力论没打多久的交道,就令人悲伤地匆匆离去,却掀开了大自然最惊人最神秘的一层面纱。
广义相对论初露锋芒的另一个例子是关于整个宇宙的起源和演化。我们已经看到,爱因斯坦证明空间和时间有赖于质量和能量的存在。时空的扭曲影响着周围物体的运动。反过来,物体运动的具体方式通过它的质量和能量又进一步影响着时间的弯曲,而这弯曲又影响着物体的运动……宇宙的舞蹈就这样一直跳下去。通过广义相对论方程——方程源自19世纪大数学家黎曼(Georg Bernhard Riemann,关于他我们以后再讲)在几十年前发现的弯曲空间的几何——爱因斯坦成功地定量描写了空间、时间和物质的相互演化。令他惊奇的是,当方程超越宇宙间的孤立系统(如恒星和围绕着它的行星、彗星),用于整个宇宙时,会得到一个惊人的结果:整个宇宙空间必然随时间变化。就是说,宇宙的结构要么在扩张,要么在收缩,但绝不会静止不变。关于这一点,广义相对论方程说得很明确。
这个结论即使对爱因斯坦来说也太沉重了。他推翻了千百年来人们基于日常经验建立起来的关于空间和时间本性的直觉信念,但他却根深蒂固地相信宇宙从来就是那样,永远也不会改变。为了这一点,爱因斯坦重新审查了他的方程,添加了一个著名的宇宙学常数,以帮他避免那个变化的预言,再回到令他满意的静态宇宙。然而,12年后,美国天文学家哈勃(Edwin Hubble)经过仔细的星系距离的测量发现,宇宙正在膨胀。据说(这在今天已经是科学史上有名的故事了),爱因斯坦那时又回到了他原先那个方程,把他一时添加的东西说成是他一生最大的错误。[17]尽管爱因斯坦原来并不愿意看到那样的结果,但他的理论确实预言了宇宙的膨胀。其实,在20世纪20年代初,比哈勃的发现早几年,俄罗斯天文学家弗里德曼(Alexander Friedmann)就用爱因斯坦最初的方程详细证明了,所有星系都将因空间结构的扩张而越来越快地彼此分离。哈勃以及后来无数的观测完全证实了广义相对论的这个惊人的结论。爱因斯坦因为解释宇宙的膨胀而获得了有史以来最伟大的一个理性胜利。
假如空间结构在扩张,星系在宇宙的长河里越流越远,那么我们可以追溯到从前,去认识宇宙的源头。如果时间倒流,空间结构会收缩,所有的星系也将越走越近。收缩的空间像一口压力锅,把星系压缩在一堆。温度大大升高了,星星一颗颗破碎了,形成滚烫的一堆等离子体(物质基本组元之一)。空间继续收缩,温度不断升高,原初等离子体的密度也一样地无限增大。假如时间从今天的宇宙(约150亿年)往回走,就我们所知,宇宙会被挤压得越来越小。构成万物的物质——不论地球上的汽车、房子、高楼大厦、高山大海,还是地球和月亮;不论土星、木星和其他行星,还是太阳和银河系的其他恒星;不论是仙女座的千亿颗星星,还是千亿个星河——都将被宇宙的大手捏成重重的一团。随着时间流向更远的过去,整个宇宙会缩得更小,仿佛一个橘子、一个柠檬、一粒豌豆或一粒沙,而且一直收缩下去。回到“开始”,宇宙似乎是一个点——我们在以后的章节会再来讨论这个点的图景——所有的物质和能量都挤在这一点,谁也想象不出它的密度有多大,温度有多高。
仿佛炸弹炸出无数弹片,大爆炸炸出了宇宙万物,我们该牢记这幅图景;不过,还有一点容易误会的地方。炸弹的爆炸,总是发生在空间的某个位置,在时间的某一时刻,而弹片在周围空间飞溅。对大爆炸来说,没有周围的空间。当我们回溯宇宙的开端,万物拥挤在一起,那是因为整个空间也在收缩。从橘子到柠檬到沙粒,宇宙越缩越小——我们说的是宇宙的整体,不是宇宙中的某些东西。当时间回到起点,空间也不存在了,只有那点原初的火球。所以,大爆炸是压缩的空间的喷发,它像浪潮那样扩张,把物质和能量带到今天。
广义相对论对吗
凭我们今天的技术水平,还没有在实验中发现背离广义相对论预言的事情。也许,未来更高精度的实验能发现点儿什么,从而最终证明广义相对论也不过是对大自然活动的一种近似的描写。不断提高实验精度来对理论进行系统的检验,当然是科学进步的一条途径,但不是唯一的途径。实际上我们已经看到了,寻找新的引力理论的动机并不是有什么实验违背了牛顿理论,而是因为牛顿理论与另一个理论——狭义相对论——发生了矛盾。牛顿理论的实验缺陷,是在另一个对立的引力理论(广义相对论)发现以后,从两个理论细微然而可测的偏差中显露出来的。因此,理论的内在矛盾在推动科学进步中,也起着与实验同等重要的作用。
半个世纪以来,物理学家还一直面临着另一个理论冲突,与狭义相对论和牛顿理论的冲突一样激烈。那就是,广义相对论与另一个经过极严格检验的理论,量子力学,在根本上似乎是不相容的。虽然我们讲了那么多,但这个矛盾使物理学家还不知道在大爆炸的那一刻,当空间、时间和物质统统挤成一点时,究竟发生了什么;在黑洞的中心,又究竟发生了什么。而从更一般意义说,这个矛盾在警告我们,我们关于自然的概念还存在着根本性的缺陷。一些伟大的理论物理学家曾努力过,但矛盾还没解决;它当然地成了现代物理学的中心问题。为认识这个矛盾,还需要懂一点儿量子理论的基本特征,我们接下来就去看看。
第4章 奇异的微观世界
穿过太阳系,回到地球,乔治和格蕾茜累极了。他们来到一家量子酒吧,想好好轻松一下,走出太空的影子。乔治要了他们常喝的饮料——他自己喝加冰块儿的木瓜汁,格蕾茜喜欢伏特加汽水。然后,乔治点燃一支过滤嘴雪茄,仰靠在椅子上,双手抱着头。他正要好好吸一口,才惊奇地发现雪茄不见了,从他的牙缝里溜走了。大概是从嘴里滑下来了,他这么想,然后坐起身,看它有没有在衬衫或裤子上烧个洞。他什么也没看见,雪茄不在前头。格蕾茜很奇怪,不知他在找什么。她看见那雪茄正在乔治椅子背后的柜台上。“怪了,”乔治说,“它怎么会跑到那儿去?从我脑袋里穿过去的?——可我的舌头一点儿没烧着,头上也没长什么洞啊!”格蕾茜给他检查了一下,舌头没有问题,脑袋也很正常。这时候,饮料来了。两人耸耸肩,一生经过的怪事儿够多了,今天又遇着一件。可是,酒吧里的怪事情还多着呢。
乔治看着他的木瓜汁,冰块在不停地翻滚,像碰碰车似的在杯子里撞来撞去。这回,不是他一个人碰着稀奇了。格蕾茜端着只有乔治一半大的杯子,也看见冰块在里头碰撞,而且更加疯狂。他们分不清单独的一块冰,只见它们混乱地撞在一堆。不过,这还算不得什么,更奇怪的事情在后头。乔治和格蕾茜瞪大了眼睛看着她的杯子,看到一块冰穿透杯子落在地上。他们抓过杯子,没有发现什么不对的地方。看来,冰块没有打破杯子就穿过去了。“这一定是太空旅行后的错觉。”乔治说。尽管冰块像疯了似的,但他们还是一口气把饮料喝完,回家休息了。他们匆匆离开酒吧时,竟没发现他们走过的是一道画在墙上的假门。而老顾客们已经习惯了穿墙进出,所以也没在意乔治和格蕾茜突然消失了。
百年前,正当康拉德和弗洛伊德为人类心灵带来光明时,德国物理学家普朗克(Max Planck)也向量子力学投来第一缕阳光。根据量子力学的基本概念,乔治和格蕾茜的酒吧经历,从微观的尺度看,并不需要归结到什么神秘的力量。这些陌生而奇异的事情,正是我们的宇宙在极端微小的尺度上实际发生着的。
量子框架
量子力学是我们认识宇宙微观性质的概念框架。在高速运动或大质量的情况下,狭义相对论和广义相对论曾极大地改变了我们的世界观;同样,当我们考察原子或亚原子的世界时,量子力学将揭示也许更惊人的微观特性。1965年,量子力学最伟大的实践者之一的费恩曼(Richard Feynman)写道:
费恩曼的观点是在30多年前讲的,但在今天仍然有意义。他的意思是,尽管狭义和广义相对论极大地改变了我们从前认识世界的方式,但是,假如我们完全接受理论的基本原理,那么关于空间和时间的那些陌生稀奇的东西就是自然的逻辑结果。如果你能多花些工夫来思考我们在前两章对爱因斯坦理论的描述,你将(哪怕只是那么一会儿)发现我们做的那些结论都是必然的。量子力学就不同了。1928年左右,量子力学的许多数学公式和法则就已经确立了,而且从那时起,它就做出了科学史上最精确和成功的数字预言。但是,从真正意义说,运用量子力学的人不过是跟着理论的“先人们”立下的法则和公式按部就班地去计算。并不真的懂得为什么能那么做,那么做意味着什么。与相对论不同,几乎没人能与量子力学“心灵相通”。
这些说明了什么呢?是不是宇宙在微观层次的活动方式太模糊、太离奇了?难道人类世世代代从寻常尺度的现象中发展起来的思想不能完全把握“到底发生了什么”吗?或者,也许物理学家不过是因为历史的巧合建立了量子力学那么笨拙的形式,尽管计算结果是对的,却令实在的本性更加模糊了?谁也不知道。也许在将来的某一天,某个聪明人能找到一种新体系,可以完全回答量子力学里的一切“什么”和“为什么”。当然,这也是说不定的。我们能肯定的只有一件事情,那就是,量子力学绝对地不容争辩地向我们证明了,我们熟悉的寻常世界的许多基本概念,在微观领域不再有任何意义。结果,我们必须极大地改变我们的语言和逻辑,以认识和说明原子和亚原子尺度的宇宙。
在接下来的几节,我们将建立这种新语言的基础,讲述它所带来的一些惊人的奇迹。如果你跟着我们的思路看到的还是一个古怪甚至可笑的量子力学,请你记住两件事情。第一,量子力学除了在数学上是和谐的,我们相信它的唯一理由是它做出的许多预言都得到了异常精确的证实。如果有人能说出一大堆你小时候的小秘密,你还能不相信他是你走失多年的兄弟吗?第二,许多人对量子力学都有你那样的感觉,历史上一些最伟大的物理学家也多少抱着这样的观点。爱因斯坦是完全拒绝量子力学的,甚至玻尔(Niels Bohr)这样一位量子论的核心人物和最有力的倡导者也曾经说过,谁如果在思考量子力学时不曾有过迷惑,他就没有真正懂得它。
炉子里太热了
通往量子力学的路是从一个恼人的问题开始的。我们设想一个例子。假设你家里的电烤炉是完全隔热的,你把温度定在200摄氏度,让它有足够长的时间加热。虽然在通电以前你把炉里的空气都抽干净了,但在加热炉壁的时候它的内部还是会产生辐射波,那是与电磁波形式的光和热相同的波,既可以来自太阳的表面,也可能来自烧红的铁棒。
问题来了。我们知道,电磁波带着能量——例如,地球上的生命就全靠电磁波从太阳带到地球上来的太阳能而生存。在20世纪的开端,物理学家计算了在特定温度下烤炉内所有电磁辐射所携带的能量。根据既定的计算程序,他们遇到一个荒唐的结果:对任何温度来说,炉内的总能量都是无限大!
人人都知道这是没有意义的——火热的烤炉可能藏着巨大的能量,但肯定不会是无限大。为了理解普朗克的解决方法,我们把这个问题再说得详细一点。当麦克斯韦电磁理论用于烤炉的辐射时,我们会发现炉壁产生的波在相对的两壁间必然是整数个波峰和波谷,如图4.1。物理学家用三个参数来描写波:波长、频率和振幅。波长是相邻两个波峰(或波谷)间的距离,如图4.2。因为两壁是固定的,如果挤在壁间的波越多,波长就越短。频率是波在一秒钟内完成的振荡循环的次数。显然,频率与波长是相互决定的:波长越长,频率越小;波长越短,频率越大。为什么呢?你可以想想摇动一端固定的长绳子。轻轻上下摇摆绳子的另一端,就能摇出大波长的波。波的频率等于手臂在一秒钟内摇动的次数,那当然是很小的。但是,如果想生成短波,你就得发狂似的摇动绳子,就是说,你要快快地摇,结果波的频率也高了。最后,物理学家用振幅来描写波的最大深度,见图4.2。
你也许觉得电磁波抽象了一点儿,那么我们来看另一个波的例子:拨动琴弦产生的波。不同的频率对应着不同的音调,频率越高,音调也越高。琴弦的振幅取决于我们用多大力量去拨弄它,拨得越重,为波动注入的能量就越大,而大能量带来大振幅。这是可以听到的,大振幅的声音更响亮。同样,低能量对应着小振幅、小音量。
利用19世纪的热力学,物理学家可以计算炉壁向每种可能波长的电磁波注入了多少能量——或者说,炉壁是以多大的力量“激起”每一列波的。他们得到的结果很简单:每一列可能的波——不论波长多大——都带着相同的能量(一个完全由烤炉温度决定的量)。换句话讲,炉内所有可能的波动模式都是平等的,都被赋予相同的能量。
图4.1 麦克斯韦理论告诉我们,烤炉内的辐射有整数个峰谷,即整数个完整的振荡循环
图4.2 波长是相邻两个波峰(或波谷)间的距离;振幅是波的最大高度(或深度)
乍听起来,这是一个有趣然而却很平常的结果。实际不是这样的。它宣布已成为经典物理学的那些东西崩溃了。理由是这样的:虽然根据要求,炉内的波峰和波谷都是整数,不会有更多其他可能的波动模式,但可能的波也还是无限多的——一个波总可以有更多的波峰和波谷。因为每种模式的波带着相同的能量,所以无限多的波具有无限大的能量。这样,在世纪之交,理论物理学的油膏上飞来了一只巨大的苍蝇。[19]
世纪之交的能量包
1900年,普朗克提出一个激动人心的猜想,消除了无限能量的烦恼,也为他赢得了1918年的诺贝尔物理学奖。[1]为理解普朗克的猜想,我们还是来看一个例子。假设你和一大群人——无限多的人——拥挤在一个吝啬鬼老板经营的一间寒冷的大仓库里。墙上装着令人向往的数字自动调温器,可以控制仓库里的温度。但老板收的暖气费太吓人了:如果温度调到50华氏度(10摄氏度),每人付50元;55华氏度(约12.8摄氏度),每人付55元,依次类推。你想,屋子里有无限多的人,只要打开调温器,老板就会赚得无穷多的钱。
不过,仔细读过老板的收费办法后,你发现了一个漏洞。因为老板很忙,不想找零钱(当然更不想给无限多的员工一个个地找),所以他凭一种“信誉”方式来收费。如果谁刚好能拿出那么多钱,那他就付那么多;否则,他只需要付他尽可能拿得出来而又不需要找零的钱。你想最好人人都交费,但又不能交得太多,于是把大伙的钱都集中起来,然后照下面的方式分配:一个人全拿1分的硬币,一个人全拿5分的硬币,一个人全拿1角的硬币,一个人全拿2角5分的硬币……然后,1元、5元、10元、20元、50元、100元、1000元甚至更大(也更难得一见的)面额的钞票也照这样分别叫人拿着。你大胆把调温器开到80华氏度(约26.7摄氏度),然后等着老板来。老板来了,拿1分硬币的人数给他8000枚,拿5分硬币的人数给他1600枚,拿1角硬币的人数给他800枚,拿2角5分硬币的人数给他320枚,拿1元钞票的人给他80张,拿5元钞票的人给他16张,拿10元钞票的人给他8张,拿20元钞票的人给他4张,而拿50元钞票的人给他1张(因为两张就超过80元,需要找钱了)。别的人都只有1种面额的钞票——最小的也超过了应该缴纳的,所以他们不能向老板缴费。这样,老板没能拿到他期望的无限多的钱,离开时只拿走了690元。
普朗克用非常类似的办法把炉子里荒唐的无限能量减小到一个有限的大小。他是这样做的:他大胆猜想,炉子里电磁波携带的能量跟钱一样,是一小团一小团的,它可以是某个基本“能量元”的1倍、2倍、3倍……正如我们不可能有1/3分或者3/5分的硬币,普朗克声称,对能量来说,分数也是不允许的。我们的钞票是国家银行定的。那么“能量元”呢?普朗克为了寻找一个更基本的解释,建议波的“能量元”——波所能携带的最小能量——是由频率决定的。具体说,他假定一列波所具有的最小能量正比于波的频率:高频(短波)意味着大能量,低频(长波)意味着小能量。大体上讲,长波长的辐射与短波长的辐射相比,本来就缺乏动力,就像海上汹涌的浪涛都是急剧起伏的短波,只有平静的海面才会出现悠悠荡漾的长波。
关键的一点在于,普朗克的计算证明,这些允许的波的能量团消除了前面那些荒谬的无限大的能量。不难看清这是为什么。当烤炉被加热到一定温度时,根据19世纪的热力学理论,计算预言了每列波应该贡献的共同能量。但是,假如某些波所能携带的最小能量超过了它应该贡献的能量,它就不会对总能量有贡献——这就像那些欠老板暖气费的伙计们,因为他们手里的钞票太大了,拿不出他们该缴纳的钱。据普朗克的猜想,波的最小能量正比于波的频率。所以当我们考察炉子里的高频率(短波长)的波时,总能找到最小能量大于我们期望的能量贡献的波,它们就像那些手拿大钞票的伙计,不会为19世纪物理学要求的能量带来贡献。所以,只有有限的波能对烤炉里的总能量有所贡献,从而总能量是有限的——只有有限的伙计能缴纳他们的暖气费,老板只能收到有限的钱。钱也好,能量也好,我们靠它们不断增大的基本单位——如越来越大面额的钞票或者越来越高的频率——让无限大的结果回到了有限。[2]
消除了毫无意义的无限大结果,普朗克迈出了重大的一步。不过人们是真相信他的猜想是对的,还是因为新方法计算的有限的烤炉内的能量与实验测量的结果惊人的一致。更特别的是,普朗克在计算里调节了一个参数,从而准确预言了在任意温度下测量的烤炉的能量。这个新进入计算的参数是波的最小能量单元与频率间的比例因子——也就是著名的普朗克常量,记为——大约是平常单位的千亿亿亿分之一。[20]普朗克常量这样小,说明基本能量包的尺度也是非常小的。这也就是为什么我们觉得可以让琴弦的能量连续地变化,从而听到连续变化的琴声。虽然,照普朗克的观点,波的能量实际上是一点点传播的,但那些“点”确实太小了,一点跟着一点,仿佛是光滑连续流动的。根据普朗克的论断,这些能量包随波频率增大(即波长减小)而增大,这是解决无限大能量疑难最关键的一点。
我们将看到,普朗克的量子假说远不仅是让我们回答了烤炉的能量问题,它还推翻了好多我们认为理所当然的世界观。因为太小,所以只有在微观世界里才会发生偏离我们日常生活的事情。但是,如果“碰巧”大得多,那么量子酒吧[21]里的稀奇事情就会在我们身边随处发生了。我们将看到,那些怪事儿在微观世界里确实是发生了。
能量包是什么
普朗克引进他那革命性的能量包并没有什么根据。不论他自己还是别的人,除了知道它能用以外,找不到一点儿令人信服的理由说明它为什么是对的。物理学家伽莫夫(George Gamow)曾经说过,大自然似乎喜欢喝酒,一喝就是一瓶,要么一滴也不喝,绝不会点点滴滴到天明。[22]1905年,爱因斯坦找到了一个解释,因为这个发现,他获得了1921年的诺贝尔物理学奖。
爱因斯坦的觉悟来自他对所谓“光电效应”的思考。1887年,德国物理学家赫兹(Heinrich Hertz)第一次发现,当电磁辐射(光)照在某些金属上时,金属会发出电子。这件事情本身并不特别值得注意。金属的一个特性就是,它的某些电子只是松散地束缚在原子里(这也是为什么金属是良好的导电体)。光照在金属表面时,会将能量释放出来,就像在阳光下我们会觉得皮肤暖洋洋的。这些能量会激发起金属里的电子,一些松动的电子就可能完全脱离金属表面跑出来。
但是,当我们更仔细地来研究射出电子的性质时,光电效应的奇异特征就表现出来了。乍看起来,你可能以为如果光的强度增大了(光更亮了),射出的电子的速度就会增大,因为入射电磁波的能量大了。但事实不是这样的。虽然这时候射出电子的数目增大了,但它们的速度并没有改变。另一方面,实验却发现,在入射光的频率增大时,射出电子的速度确实会增大;同样的,如果光的频率降低了,电子的速度也会减小。(对电磁波谱的可见部分来说,频率的增大相当于光从红色变到橙色、黄色、绿色、蓝色、青色,最后到紫色。频率比紫色光更高的是看不见的紫外线,然后是X射线;频率比红光还低的光是看不见的红外辐射。)实际上,如果入射光的频率减小了,会出现射出电子为零的情形。这时不论光源多么强大炫目,电子都只停留在金属表面。由于某种未知的原因,入射光的颜色——而不是总能量——决定着电子是否发射出来,并且决定着射出电子的能量。
为明白爱因斯坦是如何解释这个难题的,我们还是回到那家大仓库。这时,仓库里的温度是80华氏度(约26.7摄氏度),暖洋洋的。我们想象那老板还有个毛病,他不喜欢孩子,让15岁以下的儿童都住在仓库中阴暗的地下室,大人们可以从仓库四周的回廊看到他们。另外,如果孩子们想走出仓库,只有一个办法,就是向门卫缴纳8角5分的出门费。(那老板可真不是东西!)大人们只能从回廊上向孩子们扔钱,而他们还是像以前缴暖气费那样分别拿着不同的钞票。现在来看会发生什么事情。
拿1分硬币的人先开始往下一点儿一点儿地扔。但是太小了,离孩子们需要的出门费还远着呢。因为孩子太多,都争着来抢扔下去的钱,即使拿硬币的大人扔得再多,也不够让哪一个孩子凑足他需要的85分。拿5分、1角、2角5分硬币的人也会遇着同样的麻烦。硬币不管扔了多少,孩子能抢到一个就算幸运了(大多数是空欢喜一场),谁还能拿够离开所需要的85分呢?不过,拿钞票的人接着开始往下扔了,虽然是1元1元地扔,总数也不多,但只要孩子能幸运地拿到一张,他马上就可以走了。如果那人把钞票放在桶里,一桶一桶往下放,那么每次就能有更多的孩子离开,而且每个孩子把钱交给门卫后还能剩15分。不管扔的钞票有多少,结果都是这样的。
光电效应里发生的事情差不多也是如此。根据前面讲的那些实验事实,爱因斯坦建议用普朗克的波动能量包来重新描绘光的图景。在他看来,一束光其实可以认为是一股光粒子流——后来化学家刘易斯(Gilbert Lewis)为光的微粒起了一个好听的名字——光子(在第2章光子钟的例子里,我们已经用过这个概念了)。为了有一个量的感觉,我们拿灯泡为例。根据光的粒子观,一只普通100瓦的灯泡每秒钟大概会发出1万亿亿(1020)个光子。爱因斯坦用这个新概念提出了光电效应背后的微观机制:他指出,当一个电子被足够能量的一个光子击中时,它就会从金属表面逃逸出来。那么,是什么决定单个光子的能量呢?爱因斯坦跟着普朗克的引导,提出每个光子的能量正比于光波的频率(比例因子是普朗克常量)。
像那些孩子离开地下室需要起码的出门费,光子必须具备一定的能量才可能将电子从金属表面解放出来。(孩子们会争抢扔来的钱,而一个电子也几乎不可能同时被几个光子击中——多数电子根本碰不上光子。)假如入射光的频率太低了,每个光子就没有足够力量激活电子。就像一枚枚硬币,扔得再多也救不了孩子,低频的光束(从而低能量的一个个光子)不论多强,也解放不了一个电子。
只要钞票来了,孩子们就可以离开仓库;同样,只要照在金属表面的光有足够的能量“元”,电子就可以脱离出来。正如拿钞票的人通过每次多扔下一些(如装在桶里)来增大总钱数,一定频率的光束也可以通过增加光子数来增大总的强度。钞票越多,能离开的孩子越多;同样,光子越多,脱离金属表面的电子也越多。不过请注意,从金属表面逃逸出来的电子的能量余额仅取决于击中它的光子的能量——而这能量是由光束的频率(而不是总强度)决定的。每个解放的电子带着相同的能量——也就是具有相同的速度——不论照射的光有多强。这就像离开仓库的孩子,不论大人扔下来多少钞票,每个孩子都还剩下15分。更多的钱只不过可以让更多的孩子离开;更多的总能量也不过是多解放一些电子。如果想让离开的孩子多带些钱,让逃逸的电子跑得更快,我们必须增大钞票的面额,提高入射光的频率——就是说,增大照在金属表面的光子所具有的能量“元”。
这些都与实验事实完全一致。光的频率(颜色)决定着射出电子的速度,光的总强度决定着射出电子的数量。这样,爱因斯坦证明了,普朗克的能量包猜想实际上反映了电磁波的一个基本特性:电磁波由粒子即光子组成,是一束光的量子。因为波是由这样的基元构成的,所以能量也就以“元”为单位了。
爱因斯坦的发现是一大进步,但我们接下来会看到,事情并不像表面那样简单。
是光还是粒子
大家都知道,水——当然还有水波——是由大量水分子组成的,那么,光波由大量粒子(即光子)组成还有什么奇怪的吗?是的,但奇怪的是别的东西。我们知道,牛顿在300多年前就讲过光是粒子流组成的,所以这想法一点儿也不新鲜。但是,牛顿的一些同行,特别如荷兰物理学家惠更斯(Christian Huygens),却不赞同他的观点,他们认为光是波。争论了许多年,最后,英国物理学家托马斯·杨(Thomas Young)在19世纪初做的实验证明牛顿错了。
图4.3 在双缝实验中,光照在开了两条缝的薄障碍物上,通过单缝和双缝的光都将记录在后面的一块照相板上
杨做的著名的双缝实验大致可以用图4.3来说明。费恩曼常说,量子力学的一切都可以从这个简单实验的思索中得到,所以我们应该好好来讨论它。从图4.3可以看到,光照在开了两条缝的一块薄薄的障碍物上。照相板用来记录通过缝隙的光——照片上的区域越明亮,说明通过的光越多。实验让光分别通过单缝和双缝,然后比较它们在照相板上留下的图像。
假如关闭左缝,打开右缝,相片将是图4.4的样子。这很好解释。因为打在照相板上的光一定是穿过右缝的,所以集中照在相片的右边。同样,如果关闭右缝,打开左缝,相片会像图4.5的样子。假如两条缝都打开,那么照牛顿描绘的光的粒子图像,照相板应该像图4.6的样子,是前两个图的综合。大致说来,如果我们把牛顿的光微粒看成打在墙上的一颗颗小弹丸,那些通过缝隙的光就会集中在与缝平行的两个小区域。另一方面,光的波动图景在双缝打开时会表现出极不相同的景象。我们来看看吧。
图4.4 右缝打开的实验,结果显示在照相板上
图4.5 与图4.4类似,不过开的是左缝
图4.6 牛顿的光的粒子观点预言,当双缝都打开时,图像应该是图4.4和图4.5的综合
我们先考虑水波,光波的结果也是一样的,不过水更容易想象。当水波涌向障碍,穿过缝的波会一圈圈向外展开,就像一颗石子儿扔进了池塘,如图4.7。(拿一张开着两缝的卡片放在一盆水里,很容易做这个实验。)当波从两缝展开,相互重叠时,会发生一件有趣的事情。假如两个波峰相遇,那一处的水波会增高;它是两个峰的高度之和。假如两个波谷相遇,水凹陷的深度也同样会增加。最后,假如来自一缝的波峰与来自另一缝的波谷相遇,它们会彼此抵消。(实际上,消声器就利用这个道理——它测出输入的声波波形,然后生成与之“相对”的波,使它们相互抵消,消除不需要的噪声。)除了这些极端重叠的波——如波峰遇波峰、波谷遇波谷和波峰遇波谷——在它们之间还有大量部分增强或减弱的波。假如你跟许多伙伴分别坐在小船上,平行于障碍物排成一列,那么在水波经过时,你们会感觉到不同程度的颠簸。在波峰(或波谷)相遇的地方,颠簸会很强烈;在波峰与波谷相遇的地方,颠簸会很微弱,甚至一点儿也没有,因为那里的波被抵消了。
因为照相板记录了光打在板上的强弱情况,将上面关于水波的论证用于光的波动图像,我们可以发现当两条缝都打开时,照相板应该是图4.8的样子。图中最明亮的区域是来自两缝的波峰(或波谷)相遇的地方,暗区域则是一个波的波峰与另一个波的波谷相遇的地方,那里的波相互抵消了。这种光的明带与暗带交错的序列,就是有名的波的干涉模式。图4.8的照片与图4.6的大不相同,因此我们可以用这个具体的实验来判别光的粒子图像和波动图像。杨做了类似的实验,结果与图4.8的相符合,从而证实了波动图像。牛顿的微粒说失败了(不过,多年以后,物理学家才接受了这一点)。后来,麦克斯韦为流行的光的波动观奠定了坚实的数学基础。
图4.7 源自两缝的水波一圈圈向外扩展,有些地方波动加强,有些地方波动减弱
图4.8 假如光是一列波,那么当双缝都打开时,来自每一条缝的波将发生干涉
但是,打倒了牛顿的神圣引力理论的爱因斯坦,现在却似乎又通过他的光子复苏了牛顿的光的粒子模型。当然,我们也面临着跟他同样的问题:粒子的图像如何能够解释图4.8中的干涉模式呢?也许,你马上会想到一种解释:水不是由H2O分子——水“粒子”组成的吗?但大量分子形成的分子流却能生成水波,表现出图4.7所示的干涉特性。那么,我们似乎有理由猜测,光的波动特性(如干涉模式)也可以来自光的粒子图像,只要光的粒子(光子)数足够大。
可微观世界更加难以捉摸。实际上,即使图4.8里的光源强度越来越弱,直到光子以缓慢的速率(例如每10秒钟发出一个)逐个地打在障碍上,在照相板上仍然会产生像图4.8那样的结果:只要等待足够长的时间,大量分离的光子将穿过缝隙,每一个光子都记录在它打在照相板的那一点,这些点将形成图4.8里的干涉图样。这是很令人惊讶的,相继通过缝隙然后独立打在照相板上的一个个光子,如何能够“协同地”打在照相板上产生干涉波的明暗条带呢?照传统的思维,我们以为一个光子要么通过左缝,要么通过右缝,从而应该看到图4.6的样子,但事实却不是这样的。
假如这些事实没能让你感到惊讶,那可能因为你以前就知道了,或者你对什么都漠不关心,要么就是上面讲的还不够生动。为了避免后面这种情况,我们在这里以稍微不同的形式再把它讲讲。我们先将左缝关闭,让光子一个个地通过障碍,有的通过了,有的没有通过。那些落到照相板上的一个个光子的确会生成图4.4那样的图形。然后,换一块新的照相板重做一次实验,不过这回让两条缝都打开。当然,你可能认为这只不过让更多的光子通过障碍打到照相板,因而板面会出现比第一次实验更多的光亮区域。但是,实验过后拿照片来看时,你会发现,除了意料中的有些原来暗的地方现在明了,还有些原来明的地方现在却暗了,如图4.8。我们增大了落到照相板的光子的数目,却同时减少了某些区域的亮度。看来,在时间上分离的一个个光子能以某种方式相互抵消。就是说,原来能通过右缝打在图4.8的照相板上某个暗带的光子,在左缝打开时却过不去了(因为这一点那些带才成了暗的)。想想看,这事有多奇怪。一小束光是否通过一条缝,完全取决于另一条缝是否打开,世界上怎么可能有这样的事情?这真像费恩曼讲的那样奇怪:假如朝照相屏幕打枪,当两条独立的缝开着时那些独立射出的子弹似乎彼此吞没了,结果失去了好多目标——而那些目标在一条缝开着时都是被打中了的。
这些实验说明爱因斯坦的光粒子大不同于牛顿的光微粒。尽管光子也是粒子,它们却不知怎么也表现着光的波动特征。粒子的能量由波的特征——频率——决定,从这个事实我们开始隐约感到波与粒子的奇特统一。而光电效应和双缝实验则真的把那统一实现了。光电效应证明光具有粒子特性,双缝实验证明光能表现波的干涉特性。两个事实结合起来证明了光同时具有粒子和波的特性。在微观世界里,我们必须摆脱在宏观世界形成的直觉——事物要么是粒子,要么是波;我们应该接受这样的事实,它可能既是波,也是粒子。我们现在该明白费恩曼说的那句话了,“没人懂得量子力学”。我们可以讲什么“波粒二象性”,可以将它表达为数学形式,以令人惊讶的精度来描写现实的实验。但是,我们真的很难从更深的直觉的水平去认识微观世界的奇异特征。
物质都是波
在20世纪开头的二三十年里,许多大理论物理学家都在不遗余力地建立一个数学上合理而又有物理学意义的体系,来认识那些还隐藏着的事物的微观特性。例如,在哥本哈根的尼耳斯·玻尔的领导下,从炽热的氢原子发出的光的性质得到了很好的解释。但是,这同其他20世纪20年代中叶以前的工作一样,不过是19世纪的旧观念与新量子概念的临时凑合,而不是一个和谐的关于物理宇宙的认识体系。与牛顿定律或麦克斯韦电磁理论那清晰的逻辑体系相比,这些部分发展起来的量子理论还处在混沌状态。
1923年,年轻的法国贵族德布罗意(Louis de Broglie)为这场量子论战增添了新内容,他因此赢得了1929年的诺贝尔物理学奖。在爱因斯坦狭义相对论的逻辑链的启发下,德布罗意提出,波粒二象性不仅适用于光,也适用于物质。他的论证大致是这样的:爱因斯坦的E=mc2联结了质量与能量,普朗克和爱因斯坦又把能量与波的频率联系起来,那么这两点的结合意味着物质也该具有波一样的形态。沿着这条思路仔细走下去,德布罗意提出,既然量子理论说明波动的光可以用粒子来描写,那么我们通常以为是粒子的电子,也应该可以同样有效地用波来描写。爱因斯坦很快就喜欢了德布罗意的思想,认为那是他的相对论和光子思想的自然结果。即使如此,它还是离不开实验的检验。实验很快就来了,是戴维逊(Clinton Davisson)和革末(Lester Germer)做的。
20世纪20年代中叶,贝尔电话公司的两个实验物理学家戴维逊和革末研究电子束如何从镍反射回来。与我们有关的细节是,镍晶体在实验中起着图4.8中双缝的作用。——实际上,完全可以认为那就是一个双缝实验,只不过以电子束代替了光束。我们下面就从双缝实验的观点来讨论。戴维逊和革末让电子通过双缝打在磷光屏上,屏幕闪烁一个亮点记下电子的位置——这也就是在电视机内部所发生的——他们发现了令人惊奇的事情:出现了像图4.8那样的干涉图样。于是,他们的实验证明了电子也表现出干涉现象,那正是波的标志。屏幕上的黑点是电子不知怎么在那里“消失了”,就像水波的波峰与波谷在那儿相遇。即使把电子束减弱,例如,弱到10秒钟射出一个,那一个个电子仍然会形成明暗相间的条带。每一个电子都像光子那样,以某种方式相互“干涉”——说干涉,是因为它们在一定时间内重新形成了与波相联系的干涉图样。我们不可避免地会得到这样的结论:电子除了我们熟悉的粒子形态之外,还被赋予了波的特征。
尽管我们只谈了电子,类似的实验证明一切物质都具有波的特征。但是,为什么我们现实经历的事物却是硬邦邦的,一点儿都不像波呢?这问题好,德布罗意写下了一个物质波波长的公式,它表明波长正比于约化普朗克常量。(更准确地说,波长等于除以物体的动量。)因为很小,所以计算出的波长与寻常尺度相比也小得可怜。这也是为什么只有在微观的考察中才能直接看见物质的波动性。巨大的光速c遮挡了时间和空间的本性,微小的则令寻常世界的物质隐藏了它们波动的一面。
什么波
戴维逊和革末发现了电子的干涉现象,使电子的波动特征实在地显露了出来。但那是什么波呢?奥地利物理学家薛定谔(Erwin Schrödinger)先提出那些波是“抹开了的”电子,这有点儿电子波的意思,但太模糊了。当我们将某样东西抹开时,它总会东一点西一点的;然而,对电子来说,谁也没见过半个、1/3个或者其他分数的电子。这样,我们很难把握抹开的电子到底是什么。1926年,德国物理学家玻恩(Max Born)提出了另一种建议,极大地修正了薛定谔的电子波解释,他的新解释——经过玻尔和他的同事们的发扬光大——在今天仍然伴随着我们。玻恩的解释是量子理论最奇异的特征之一,不过已经得到了大量实验数据的证实。他指出,应该从概率的观点来看电子波。波的振幅(更准确些说,是振幅的平方)大的地方,电子出现在那儿的可能性越大;波的振幅小的地方,电子出现在那儿的可能性越小。图4.9是一个例子。
图4.9 哪里最容易找到电子,哪里的电子波最大;而在波小的地方发现电子的机会也越小
这真是奇特的想法。基础物理学的建立与概率何干呢?我们只是在赛马、扔硬币和轮盘赌的场合才习惯概率,那不过反映了我们知道得不完备。例如,在轮盘赌中,假如我们完全知道轮盘的速度,小球的硬度和质量,它落在盘中的位置和速度,以及小格子的具体构成材料,等等,假如我们有足够强大的计算机来完成需要的计算,那么,根据经典物理学,我们能够预知那小球会滚落在什么地方。赌牌的趣味正在于人们不可能在押赌注以前判断所有的信息和进行必要的计算。但是,我们在轮盘赌遇到的概率问题一点儿也没有反映宇宙活动的任何特别基本的东西。而量子力学却把概率概念植入了宇宙的深处。根据玻恩的理论和后来半个多世纪的实验,物质的波动性质意味着我们应该从根本上以概率的方式来描述物质本身。对宏观物体来说,如咖啡杯或轮盘,德布罗意的公式说明它们的波动性质微不足道,所以在大多数普通情形中,我们可以完全忽略与物体相关的量子力学概率。但是,在微观水平上,我们知道我们最多不过能说在特定地方找到一个电子的概率。
概率解释的好处在于,当电子波像其他波那样活动时——例如,穿过障碍物,形成各种波荡漾开去——并不是说电子本身裂成了碎片,而是说电子可能以较大的概率在许多位置出现。实际上,这就是说,假如我们以绝对相同的方法重复某个有电子参与的实验,我们不会总是得到相同的结果。例如,我们可能发现一个电子在不同的位置出现。而且,不断重复实验将得到各种不同的结果,在某一位置发现电子的次数,将由电子概率波的形状决定。假如A处的概率波(准确地说,应该是概率波的平方)是B处的2倍,那么经过一系列实验以后,在A处找到的电子应该是B处的2倍。我们不可能预言精确的实验结果,我们最多只能预言某个结果可能出现的概率。
即使如此,只要能从数学上决定概率波的精确形式,我们就能通过多次重复某个实验来观测某一结果发生的可能性,从而检验那些概率的预言。德布罗意的建议提出没几个月,薛定谔就迈出了决定性的一步。他写下了一个方程,能决定概率波的形状和演化——我们今天把那概率波叫波函数。薛定谔的方程和概率波的解释很快就做出了令人惊讶的精确的预言,于是,到1927年时,经典物理学的纯真时代结束了,宇宙不再是一只精确的大钟。过去我们总以为,宇宙间的一切事物都照一定的节律运动,它将从过去某个时刻走向它唯一注定了的终结。根据量子力学的观点,宇宙也遵照严格准确的数学形式演化,不过那形式所决定的只是未来发生的概率——而不是说未来一定会发生什么。
许多人感到这个结论太困惑,甚至完全不能接受。爱因斯坦就是这样的一个人。他在警告量子力学的拥戴者时,说过一句在物理学史上鼎鼎有名的话:“上帝不会跟宇宙玩骰子。”他觉得,概率在基础物理学中出现是因为某种说不清的理由,像在轮盘赌中那样,概率出现是因为我们的认识从根本上说还不够完备。在爱因斯坦看来,宇宙没有给靠机会实现的未来留下空间。物理学应该预言宇宙如何演化,而不仅是预言某个演化发生的可能性。但是,越来越多的实验——有些令人不得不相信的实验是在爱因斯坦去世以后做的——证明,爱因斯坦错了。英国物理学家霍金(Stephen Hawking)曾说过,在这一点上,“爱因斯坦糊涂了,而量子理论是对的。”[23]
不过,关于什么是量子力学的争论今天仍在继续着。每个人都知道怎么用量子理论的方程来做精确的预言,但是,关于概率的意义,关于粒子如何“选择”它的未来,还没有一致的认识;甚至,我们还不知道粒子是不是真的选择了一个未来;也许,它会像树枝那样分开,向着不断膨胀着的平行宇宙展开它各个可能的未来。这些观点本身都应该写一本书来讨论,实际上也有好多精彩的书以这样那样的方式思考量子理论的问题。但有一点是明白的,不论我们如何解释量子力学,从日常的立场看,它都不可否认地证明了,宇宙建立在一些奇异的原则上。
我们从相对论和量子力学得到的教训是,当我们深入追寻宇宙的基本行为时,我们会遇到许多意料之外的事情。我们需要大胆提出深层次的问题,更需要巨大的勇气来适应和接受它们的答案。
费恩曼的图景
理查德·费恩曼是继爱因斯坦以来最伟大的物理学家之一,他完全接受了量子力学的概率论核心,但在第二次世界大战后的几年里,他提出了一种强有力的新方法来思考这个理论。从数值预言的角度看,费恩曼描绘的图景与以前的理论完全一致,但他的公式迥然不同。我们把它放到电子双缝实验中来讨论。
图4.8的困惑在于,我们原以为一个电子要么穿过左缝,要么穿过右缝,于是我们预料结果应该是图4.4和图4.5的综合,即图4.6。从一条缝穿过去的电子本不应该关心是不是还存在另一条缝;然而它却似乎真的多少受到了另一条缝的影响。结果表现的干涉模式说明,某种对两条缝都有“感觉”的东西相遇融合在一起了,即使电子一个个地经过,结果还是那样。为了解释这个现象,薛定谔、德布罗意和玻恩为每一个电子赋予一个概率波。电子的概率波像图4.7的水波一样,“看见”了两条缝,从而也像水波那样干涉、融合。像图4.7中波浪涌起的地方,是概率波融合增强的地方,也是电子最可能出现的地方;像图4.7中波动平缓的地方,是概率波融合相消的地方,也是电子几乎不会出现的地方。电子一个个打在荧屏上,按照这种概率波的形态分布,从而形成图4.8的干涉图样。
费恩曼的方法与众不同。传统观念认为,电子要么经过左缝,要么经过右缝,费恩曼却向它提出了挑战。可能有人会想,那是事物活动的基本特性,向它挑战岂不是太傻了。不过,你真能看见缝与屏之间的事情从而确定电子是从哪条缝穿过来的吗?是的,你能看见,但这时你就在挑战实验了。因为,你总得做点儿什么才能看到电子——例如,用光照它,也就是让光子从它反射回来。在日常的尺度,光子从树木、图画等物体上反射回来,像感觉不到的微小探针,几乎不会给那些相对的庞然大物的运动状态带去任何影响。但是,电子是小得可怜的东西,不论你怎样小心翼翼去发现它从哪条缝过来,照在它上面的光子总会影响它以后的运动。运动的改变将改变实验的结果。假如你正好通过干扰实验决定了每个电子来自哪一条缝,实验结果便从图4.8变成图4.6!量子世界保证,一旦确定了电子从哪条缝经过,两缝间的干涉现象也就消失了。
尽管据我们平常的经历,一个电子似乎应该通过一条缝,但费恩曼的挑战最终还是赢了——早在20世纪20年代后期,物理学家就意识到,任何想证实量子世界的基本物理量的尝试,都会破坏实验的结果。
费恩曼宣布,每个到达荧屏的电子实际上穿过了两条缝,这听起来是很疯狂的,但接下来还有更狂更野的事情。费恩曼说,每一个电子,从源到荧屏上某一点,实际上同时经历了所有可能的路径,其中的几条画在图4.10中。电子以良好的次序通过左缝,同时也以良好的次序通过右缝;它可能朝着左缝去,却突然在空中调头走向右缝;它可能前后犹豫,最后通过一条缝,它还可能远征仙女座星系,然后又回来穿过一条缝到达荧屏。总之,它就这样什么路都可能经历——在费恩曼看来,电子要同时去“发现”联结起点和终点的每一条可能的路径。
图4.10 根据费恩曼的量子力学形式,应该认为粒子在起点到终点间的每一条可能路径上运动。图中画出了一个电子从源到荧屏的几条可能的路径。注意这个电子实际上通过了两条缝
费恩曼证明,他能为每一条路径赋予一个数,这些数的联合平均将给出与波函数计算相同的概率结果。这样,在费恩曼的图景中,不需要为电子联系一个概率波。实际上,我们得想象另一种同样奇怪的东西。电子——通常被看作一个完完全全的粒子——到达荧屏某一点的概率由到达那一点的所有可能路径的联合效应来决定,这就是费恩曼著名的量子力学的“路径求和”方法了。[3]
在这一点上,我们学过的经典东西无能为力了:一个电子怎么能够同时经历不同的路径——而且还是无限多个呢?这似乎是很有力的反对理由,然而量子力学——关于我们世界的物理学——却要求我们把这寻常的抱怨抛到脑后。用费恩曼方法计算的结果符合波函数的方法,也都符合实验。我们应该允许大自然自己决定什么是合理的,什么是不合理的。正像费恩曼讲的,“(量子力学)描写的自然从常识看是荒唐的,但它完全符合实验。所以,我希望你们也能够那样接受她——自然本来就是荒唐的”。[24]
可是,不论微观尺度下的世界多么荒唐,在寻常的尺度下,事物还应该回到我们所熟悉的普遍状态。为此,费恩曼证明,当我们考察大物体的运动时——如棒球、飞机、行星或者其他一切比亚原子粒子大的东西——他为每条路径赋值的法则保证,所有路径在求和时会彼此抵消,最后只留下唯一的一条路径。就是说,在考虑大物体时,无限多的路径里只有一条是有意义的。那也就是在牛顿运动定律中出现的轨道。这也就是为什么我们在日常生活中看到的物体(如抛向天空的球)只沿着一条预言的唯一可能的轨道从起点走到终点。但对微观物体来说,费恩曼为路径赋值的法则说明,许多不同的路径常常都能影响物体的运动。例如,在双缝实验里,这些路径通过不同的缝,产生我们看到的干涉图像。所以,在微观领域里,我们不能判断电子通过了哪一条缝。干涉模式和费恩曼的量子力学形式特别证实了另一个事实:电子从两条缝通过了。
我们知道,对一本书或一部电影的不同解释或多或少有助于我们理解作品的不同方面;同样,我们也需要用不同的方法来看量子力学。虽然从预言结果看,波函数方法和费恩曼的路径求和方法是完全一样的,但关于事件的发生,它们是不同的思维路线。我们以后会看到,在某些问题上,这些方法都能提供不可估量的解释框架。
古怪的量子
现在你多少应该感觉到量子力学里的宇宙行为是多么奇异,假如玻尔令人眩晕的理论还没有令你着魔,那么我们现在要讲的量子至少会让你头痛一会儿。
我们很难直觉地把握量子力学——很难像一个在微观世界里出生长大的小生命那样看量子力学,这一点比相对论更困难。不过,理论中有一点可以作为我们直觉的导引,这个特征能从根本上将量子理论与经典理论区别开来。那就是德国物理学家海森伯(Werner Heisenberg)在1927年发现的不确定性原理。
这个原理是从你可能早就想到过的一个意见产生出来的。我们讲过,为了确定电子从哪条缝通过(电子的位置),必然会干扰电子以后的运动(它的速度)。可是,你可能会想,例如,为确定我们身边是不是有人,我们可以轻轻抚摸一下,或者亲热地拍拍他的背;那么,为什么不能用“更轻柔”的光,通过更微弱的干扰来确定电子的位置呢?从19世纪物理学的观点看,我们是能够那么做的。用更暗淡的灯光(以及更灵敏的光探测仪),我们可以不断减轻对电子运动的影响。但量子力学自身却暴露了这个论证的缺陷。当我们减弱光源强度时,也就在减少它发出的光子数。当光子一个个发射出来时,我们就不可能再把它减弱了,除非把光源关闭。这是量子力学对我们所能做到的“轻柔”所规定的基本极限。于是,在我们测量电子的位置时,总会引起哪怕是极小的速度干扰。
好了,那基本上是正确的。普朗克定律告诉我们,单个光子的能量正比于它的频率(反比于它的波长)。通过频率越来越低(波长越来越长)的光,我们能产生越来越轻柔的一个个光子。但问题来了:当波从物体上反射回来时,我们收到的信息只能在相当于波长的一个误差区域内决定物体的位置。为了直观感受这个重要事实,我们想象来确定一块巨大的浸没在水中的岩石。岩石能影响经过它的海浪。波有次序的一个跟着一个涌向岩石,从岩石旁边经过时,一个个波都将被破坏——也告诉我们岩石就在那里。波的一个个起伏是一列波的最基本单位,就像直尺上的精细刻度,所以通过考察一个个波是如何被搅乱的,我们就可以在一个波动周期的误差范围内,即一个波长的范围内,确定岩石的位置。在光的情形中,组成它的光子大概也可以说是一个个波动周期(波动的高度由光子决定),这样,我们用光子也只能在一个波长的精度下决定一个物体的位置。
因此,我们面临着量子力学的一种均衡行为。如果用高频率(短波长)的光,我们能以更大的精度确定电子的位置。但高频率的光子能量很大,会强烈干扰电子的速度。如果用低频率(长波长)的光,我们可以将它对电子的影响减到最小,因为光子的能量相对来说是很小的;但是,我们却将牺牲电子位置的精度。海森伯量化了这一对抗行为,在位置和速度的测量精度间建立了一个数学关系。他发现——与我们讨论的例子一致——两个精度互成反比:位置测量的高精度必然带来速度测量的大误差,反之亦然。更重要的是,尽管我们的讨论限于以一种特别的方法来决定电子的位置,但海森伯证明,不论运用什么测量仪器,采取什么测量步骤,位置与速度的测量精度间的均衡关系总是成立的。在牛顿甚至爱因斯坦的体系中,我们都是通过位置和速度来描写粒子的运动;但量子力学不同了,它证明在微观水平上,我们不可能同时完全精确地知道那些性质。而且,一个量知道得越精确,另一个量就越不精确。虽然我们这里谈的是电子,但这个思想也能直接用于大自然的一切组成因素。
为尽可能缩小量子理论与经典物理学的偏离,爱因斯坦提出,尽管量子论显然限制了人们关于位置和速度的知识,但电子仍然像我们通常认为的那样,具有确定的位置和速度。但是,在最近几十年,以已故物理学家贝尔(John Bell)为先驱的理论发现和阿斯佩克特(Alain Aspect)及其合作者们的实验结果,令人信服地证明爱因斯坦错了。电子——以及其他所有的事物——不可能同时在某个位置并具有某个速度。量子力学证明,那样的说法不仅永远得不到实验证实——我们上面解释过了——而且也跟最近得到的其他实验结果矛盾。
事实上,假如你想捕捉固体大盒子里的一个电子,为了确定它的位置,你把盒子慢慢向里挤压,这时你会发现电子变得越来越疯狂,仿佛患了幽闭症,在盒子四壁间撞来撞去,速度越来越大,越来越难预料。不过,大自然是不会让它的“骨肉”走向死路的。我们曾想象,在量子酒吧里,比它在真实世界里的值大得多,从而寻常的事物也能遭遇量子效应。例如,乔治和格蕾茜酒杯里的冰块也像染了幽闭症,狂野地撞得杯子砰砰作响。虽然量子酒吧是幻想的王国——实际的小得可怜——但这种量子幽闭现象却是微观世界普遍存在的特征。当我们考察微观粒子并将它们限定在越来越小的空间区域时,它们会变得越来越疯狂。
从不确定性原理还生出一种令人惊奇的效应:量子隧道。假如你向着3米厚的混凝土墙射出一个塑料小球,经典物理学的结论与你本能的感觉是一样的:球会反弹回来。原因是,小球没有足够的能量穿透这堵难以逾越的障碍。但是量子力学确凿地证明,在基本粒子的水平上,组成小球的粒子的波函数——即概率波——总有一小部分透过了墙。这意味着小球有小小的——但不是零——机会能穿透那堵墙,出现在墙的另一边。怎么能这样呢?原因还是在海森伯的不确定性原理。
为明白这一点,我们想象一个一贫如洗的人,他在远方的亲戚死了,给他留下一大笔遗产。然而,他没有钱买飞机票,去不了那儿。他把困难告诉了朋友:如果朋友们能帮他解决这个难题,借钱给他买张机票,他回来时可以加倍奉还。但是朋友们也没钱。不过,他忽然记起一位在航空公司的老朋友,便向他求救。那朋友还是没钱借他,但提出一个办法:他只要在到达终点后24小时内把钱电汇过来,公司的会计系统是不会发现钱是在出发以后补的。这样,他可以去继承他的财产了。
量子力学的统计过程大概也是这样的。我们已经看到,海森伯曾证明,在位置和速度的测量精度间存在一种平衡。他还证明,同样的平衡关系也存在于测量能量和测量时间的精度之间。量子力学断言,我们不能讲一个粒子在某一时刻具有某个能量。为提高能量的测量精度,必须增大测量的时间。大体上讲,这意味着在足够短的时间尺度内,粒子的能量可能疯狂地涨落起伏。所以,就像我们可以“借钱”坐飞机(只要能尽快还钱),量子力学也允许粒子“借”能量,只要它能在海森伯不确定性原理所规定的时间内把它还回去。
量子力学的数学证明,能量障碍越大,那种奇怪的微观统计行为实际发生的概率就越小。但是,面对一块石板的微观粒子,有时的确可能借来足够的能量在瞬间穿透它原来没有足够能量进入的区域——从经典物理学的观点看,这简直是不可能的。当我们研究的东西越来越复杂,组成的粒子越来越多,量子隧道效应仍然可能发生,不过越来越困难,因为那需要所有粒子都能幸运地穿过隧道。但是,乔治的雪茄消失在脑后,酒杯里的冰块从杯壁漏出,乔治和格蕾茜从酒吧的墙上穿过——这些奇异的事情都能发生。在我们假想的量子酒吧,很大,那样的量子隧道到处都是。但在真实的世界里,很小,假如你频繁走近一堵墙,根据量子力学的概率法则,你需要等待我们今天宇宙的年龄这么久,才能找到一个好机会穿墙而去。只要有耐心(还得长寿),你迟早会出现在墙的另一边。
不确定性原理抓住了量子力学的核心。我们通常认为的一些毫无疑问的基本事实——例如物体有确定的位置和速度,有确定的能量,确定的动量——现在看来不过是因为普朗克常量太小而在寻常世界表现的一些特例。更重要的是,当我们把量子思想用于时空结构时,“引力的锦绣图景”将暴露致命的缺陷,把我们引向过去百年里的第三次物理学大冲突。
第5章 渴望新理论:广义相对论与量子力学
在过去的100年里,我们对物理宇宙的认识已经非常深入了。量子力学和广义相对论的理论工具使我们懂得了很多事情,我们能够很好地预言发生在原子、亚原子领域乃至星系和星系团尺度的物理现象,甚至我们还能认识整个宇宙本身的结构。这是了不起的成就。真的,一种普普通通的生命,困在一颗小小的行星上,在一个普普通通的星系的边缘,绕着一颗普普通通的恒星旋转,却能凭他们的头脑和实验,去发现和理解物理宇宙中某些最神秘的特征。不过,物理学家天生是难得满足的,他们还要去把最幽深和基本的东西揭示出来,这就是霍金讲的,认识“上帝的大脑”的第一步。[25]
很多证据说明,量子力学和广义相对论没能达到最深层的认识。它们通常的适用范围是不同的。大多数情形,要么用量子力学,要么用广义相对论,不会同时需要它们。然而,在某些极端条件下,事物质量大而且尺度小——例如在黑洞的中心、在大爆炸时刻的宇宙——为了得到正确的认识,我们既需要量子力学,也需要广义相对论。可是,量子力学与广义相对论,一个像火药,一个像火,它们遇到一起便带来巨大的灾难。当这两个理论的方程混合起来时,好好的物理问题却得不出有意义的答案。那些无意义的答案主要是一些无限大的东西,如关于某过程的量子力学概率的预言,不是一个百分数,而是无限大。大于1的概率已经够荒谬了,无限大的概率是什么呢?我们被迫承认,一定出了什么严重的问题。通过认真考察广义相对论和量子力学的基本性质,我们可以找出毛病在哪儿。
量子力学的核心
海森伯发现不确定性原理时,物理学在那儿拐了一个大弯,但并没有停歇下来。概率、波函数、干涉和量子,都带着认识实在性的崭新思路。不过,顽固的“经典”物理学家们还抱着一丝希望,盼着当一切都弄清楚以后,这些“离经叛道”的东西将树立一个离过去思路不远的理论框架。然而,不确定性原理把所有的“复辟”幻想都扫荡干净了。
不确定性原理告诉我们,当我们考察的距离越小、时间越短,宇宙会变得越疯狂。上一章讲过,当我们想确定基本粒子(如电子)的位置和速度时,会遇到这种情况:用更高频率的光照电子,我们能以更高精度测量它的位置,但那代价是我们的观测更多地干扰了电子的运动。高频率的光子具有更多的能量,所以像针一样“扎”在电子上,从而极大地改变了它的速度。在一间满是小孩儿的屋子里,我们会遇着同样的狂乱场面。你可以精确知道每个孩子的瞬间位置,但你却几乎管不了他们的活动——向哪个方向跑,跑多快——不可能同时知道基本粒子的位置和速度,意味着微观世界在本质上是混沌的。
尽管这个例子在不确定性与疯狂性之间建立了基本联系,它也只说明了问题的一部分。你大概会认为,不确定性只有在我们这些笨拙的自然观测者闯进了它们的场景才会出现。这是不对的。电子在小盒子里飞速地撞来撞去,这个例子可能会让你更明白那是怎么回事。即使实验者没有“直接”拿光子去“打击”电子,电子速度还是会剧烈地不可捉摸地从一点变到另一点。但是,这个例子也没能完全说明海森伯的发现所隐藏的微观世界那迷人的特征。即使在我们所能想象的最宁静的场合,例如空空如也的空间区域,不确定性原理告诉我们,从微观的角度看,那里也有大量的活动。距离和时间的尺度越小,那活动就越狂乱。
明白这一点的关键是量子的会计方法。我们在前一章看到,粒子(例如电子)可以暂时“借”能量来克服难以逾越的物理障碍——就像人们常常可以借钱渡过难关。这是对的。但量子力学迫使我们将这类比向前推得更远。我们想象一个不得不靠借钱生活的人,他去求一个个朋友,每个朋友只能借他几天,他只得找更多的朋友,这家借,那家还,还了借,借了还——他费好大力气借来钱,不过是为了尽快把它还掉。像华尔街狂涨狂跌的股票价格一样,这位可怜的借钱者手里的钱也在瞬间经历着巨大的涨落。不过,当一切平息过后,他的账目说明他还跟当初一样,一点儿也没富起来。
海森伯的不确定性原理说,在微观的距离和时间间隔里,能量和动量也发生着类似的疯狂的涨落。即使在虚空的空间——例如一只空盒子——不确定性原理也会说能量和动量是不确定的:当我们从更小的时间尺度来看更小的盒子时,它们的涨落就更大。仿佛盒子里的空间也不得不“借”能量和动量,不断从宇宙把它们“借来”,接着又很快还回去。那么,在平静的空虚的空间区域里,哪些东西参与了这样的“交易”呢?什么东西都可能有,这真是难以想象的;不过,最终“流通”的还是能量(也包括动量)。E=mc2告诉我们,能量可以转化为物质,而物质也能转化为能量。这样,如果能量涨落足够大,即使在虚空的空间里,它也可以在瞬间生成正反粒子对,例如电子与它的正电子伙伴。因为这些能量必须马上归还,所以粒子对会在瞬间湮灭,归还生成它们的能量。其他形式的能量和动量也发生着相同的事情——如其他粒子的生成与湮灭、电磁场疯狂的振荡、强弱相互作用场的涨落……量子力学的不确定性原理告诉我们,宇宙在微观尺度上是一个闹哄哄的、混沌的、疯狂的世界。费恩曼曾笑话过,“生了灭、灭了生——浪费了多少时间。”[26]由于能量的借与还在平均意义上相互抵消了,所以只要不是微观地去看,空虚的空间仍然显得宁静而太平。但是,不确定性原理说明,宏观的平均的眼光模糊了众多微观的行为。[1]我们很快会看到,融合广义相对论和量子力学的那个障碍就是这里讲的那些疯狂的东西。
量子场论
20世纪三四十年代,理论物理学家们在不懈地寻找一种数学形式来描写微观世界的混沌行为,我们可以提几个杰出的名字,如狄拉克、泡利(Wolfgang Pauli)、施温格(Julian Schwinger)、戴森、朝永振一郎(Sin-Itiro Tomonaga)和费恩曼。他们发现,薛定谔的波动方程(第4章讲过)实际上只是微观物理学的一种近似描写——当我们不太深入微观的混沌时(不论实验的还是理论的),这近似是非常好的;但当我们想走得更近时,它就失败了。
薛定谔在他的量子力学方程里遗忘了一个重要的东西,那就是狭义相对论。实际上,他当初确实试过把狭义相对论包括进来,但后来发现那方程做出的预言不符合氢原子的实验观测。于是薛定谔继承了物理学的老传统,将问题分开来解决:不急着跨一大步把所有新发现的物理学东西都塞进一个新的理论;通常更好的办法是小步、小步地走,一步步地把研究前沿的最新发现囊括进来。薛定谔发现并建立的数学方程包含了实验发现的波粒二象性,但在那个初步认识的年代,他没有包括狭义相对论。[2]
但物理学家很快发现,狭义相对论对一个正确的量子力学框架来说是很重要的。这是因为,微观的混沌行为让我们看到了能量可以有多样表现形式——这个观点来自狭义相对论的E=mc2的结果。薛定谔的方法忽略了狭义相对论,也就忽略了物质、能量和运动的重要性。
为了把狭义相对论与量子概念结合起来,物理学家们首先把力量集中在电磁力与物质的相互作用上。经过一系列激动人心的进步,他们创立了量子电动力学。这是后来相对论量子场论(或简称量子场论)的一个例子。说它是量子的,因为概率和不确定性的观点从一开始就融合在理论中了;说它是场论,因为它把量子原理融入了以前的经典力场的概念——在这里,那是麦克斯韦的电磁场。最后,我们说它是相对论的,因为狭义相对论也是从一开始就走进来了。(如果你想对量子场有一个直观的认识,你可以很好地借助经典场的想象——例如,数不清的看不见的力线穿过空间——不过,那图像应该有两个特点:第一,量子场应该由粒子构成,就像电磁场由光子组成一样;第二,能量应该以粒子质量和运动的形式出现,它不停地在量子场之间往来波动,在空间和时间里不停地振荡。)
量子电动力学可以说是有史以来关于自然现象的最精确理论。我们可以从木下东一郎(Toichino Kinoshita)的例子来说明这种精确。木下是康奈尔大学的粒子物理学家,在过去的30年里,他一直在艰辛地用量子电动力学计算电子的某些具体性质。他的计算写满了几千页,最后还是世界上最大的计算机来完成的。他的努力是值得的:计算的结果在小数点后面十二位都得到了实验的证实。这绝对是抽象的理论计算与现实世界之间惊人的契合。通过量子电动力学,物理学家能在完备、实用、可靠的数学框架下巩固光子作为“最小的一束光”的角色,揭示它们与带电粒子(如电子)的相互作用。
量子电动力学的成功激励其他的物理学家在20世纪六七十年代去发展一门类似的新的量子力学方法,以认识弱、强和引力的作用。结果证明,对弱力和强力来说,这是一条硕果累累的道路。通过与量子电动力学类比,物理学家构造了强力与弱力的量子场论,叫量子色动力学和量子弱电理论。“量子色动力学”这个色彩绚丽的名字,在逻辑上该叫“量子强动力学”,但那不过是一个名字而已,没有别的更深的意思。[27]另一方面,“弱电”这个名字确实概括了我们在认识自然力的长路上所树立的一座里程碑。
格拉肖(Sheldon Glashow)、萨拉姆(Abdus Salam)和温伯格(Steven Weinberg)证明了弱力与电磁力可以自然地用他们的量子场理论统一起来——尽管两种力在我们周围世界的表现好像是迥然不同的,凭借这项研究,他们共同获得了1979年诺贝尔物理学奖。毕竟,除了在亚原子的尺度内,弱力场几乎消失了,没有一点儿作用;而电磁场——可见光、无线电波、电视信号、X射线……却是我们离不开的宏观实在物。不过,格拉肖、萨拉姆和温伯格从根本上证明,在足够高的能量和温度下——如在大爆炸的几分之一秒内——电磁场和弱力场熔化在一起,表现出不可分辨的特征,应该更准确地叫弱电场。当温度下降,电磁力与弱力便结晶似地分离开来(分离的过程实际从大爆炸时就开始了),具有与高温下不同的形式——这样一个过程就是有名的“对称破缺”,我们会在以后慢慢讲——从而在我们今天冰冷的宇宙中表现得迥然不同。
好了,现在我们知道,到20世纪70年代,物理学家已经对四种力中的三种(强、弱、电磁)做了合理而成功的量子力学描述,还证明了其中的两种(弱和电磁)实际上有着共同的起源(弱电力)。在过去的20年,物理学家做了大量实验,通过那三种力的自我表现和它们在第1章介绍的物质粒子中的作用,来检验量子力学的处理方法。理论安然面对了所有的实验挑战。实验家们测量了19个特别的参数(表1.1中的粒子质量和第1章注释1中补充的力荷、表1.2中的三个力的强度,以及几个别的我们不需要讨论的参数),理论家将这些数引进物质粒子和三种力的量子场理论,结果,这个微观宇宙的理论做出的预言与实验符合得好极了。在我们今天的技术条件下——所达到的能量可以将物质粉碎到一百亿亿分之一米的大小——理论都是正确的。因为这一点,物理学家把这个关于引力外的三种力和三族物质粒子的理论叫作标准理论,或者,更多的时候称它是粒子物理学的标准模型。
信使粒子
根据标准模型,强力和弱力的场也有最小的组成粒子,就像电磁场以光子为最小组成一样。我们在第1章曾简单讲过,最小的强力单元是胶子,而最小的弱力单元是弱规范玻色子(或者,更准确地说是W和Z玻色子)。标准模型要求我们把这些力的粒子看成没有内部结构的——在这样的框架下,这些粒子全都是基本的,跟那三族物质粒子一样。
光子、胶子和弱规范玻色子提供了它们所组成的力的微观传递机制。例如,当一个带电粒子排斥另一个带同性电荷的粒子时,我们大体上可以想象每个粒子都裹着一个电场——一团“电的云雾”——每个粒子感觉的力就源自那“两团云”的排斥。不过,更准确的量子图景却多少有些不同。一个电磁场由一群光子组成,两个带电粒子间的相互作用实际上是光子在两个粒子间往来“出没”的结果。两个带电粒子通过交换小小的光子而相互影响,这个过程有点儿像两个溜冰的人连续不断地相互传球,通过传球,两个人的运动状态都将受到影响。
然而溜冰者的比喻却有一个大毛病,那就是传球总是“排斥性的”——它使两个人越离越远。不同的是,带相反电荷的粒子也通过交换光子发生相互作用,而那电磁力却是“吸引的”。看来,光子似乎并不是力本身的传递者,它只不过是传递“消息”,告诉粒子该如何响应那个力。对同性电荷的粒子,光子带来的消息是“离开”;而对异性电荷的粒子,那消息是“走近”。因为这一点,我们有时说光子是电磁力的信使粒子。同样,胶子和弱规范玻色子分别是强力和弱力的信使粒子。把夸克锁在质子和中子里的强力起源于一个个夸克交换胶子。可以说,胶子真就像把这些亚原子粒子紧紧黏在一起的“胶”。弱力决定着粒子的某种放射性衰变的嬗变过程,它的中介是弱规范玻色子。
规范对称性
你大概已经看到了,我们关于自然力的量子理论的讨论还遗漏了一个奇异的角色,那就是引力。物理学家靠那个方法成功地处理了其他三种力,你可能会建议他们去寻找一个引力的量子场理论——在那个理论中,引力场的最小单元引力子应该是它的信使粒子。乍看起来,这该是一个特别合时宜的建议,因为另外三种力的量子场论告诉我们,它们与我们在第3章遇到的引力的某个方面之间存在着诱人的相似。
回想一下,引力让我们能够把所有的观察者——不论他们的运动状态如何——看作绝对平等的。即使通常认为在加速运动的人,也能说自己是静止的,因为他可以把感觉到的力归结为他处在一个引力场中。在这个意义上,引力强调对称:它保证所有可能的观察者的观点以及所有可能的参照系都是同样有效的。同样,强力、弱力和电磁力也都通过对称性相联系,虽然那些对称比同引力相关的对称要抽象得多。
为了粗略体会这些难以捉摸的对称性原理的意思,我们考虑一个重要的例子。我们记得,在第1章后面的注释里,每个夸克都带着三种“颜色”(我们想象那是红、绿、蓝,当然这不过是一些标签,与通常看到的色彩没有一点儿关系),这些颜色决定着夸克该如何“响应”强力,就像电荷决定着对电磁力的响应一样。在得到的所有数据的基础上,我们建立了夸克间的一种对称性,那就是,同色夸克(红与红、绿与绿或蓝与蓝)间的相互作用都是相同的,不同色夸克(红与绿、绿与蓝或蓝与红)间的相互作用也是相同的。实际上,我们还从数据发现了更令人惊奇的事情。假如夸克携带的三种颜色(三个不同的强荷)都“转移”了(用假想的色彩来说,大概意思是,红、绿、蓝转移成黄、青、紫),甚至它们每时每刻从一个地方到另一个地方都在不停地转移,夸克之间的相互作用却一点儿也不会改变。因为这一点,我们说宇宙体现着一种强力对称性:物理学不因力荷的转移而改变——或者说,物理学一点儿也不知道力荷转移了。这很像我们说球体现着旋转对称性,因为不论我们在手里怎么转,不论转多大的角度,球看起来都是一样的。由于历史的原因,物理学家也说强力对称是规范对称的一个例子。[3]
我们来看关键的一点。在广义相对论中,为使所有可能的观察立场都处于对称地位,必须要求存在引力。类似地,从外尔(Hermann Weyl)20世纪20年代以及杨振宁和米尔斯(Robert Mills)20世纪50年代的工作发展起来的规范对称性也要求存在另外一些力。根据杨振宁和米尔斯的观点,那些力场能完全补偿力荷的转移,从而完全地保证粒子间的物理相互作用不会改变。这很像一个灵敏的环境控制系统,通过彻底补偿任何外来的影响而使一个区域内的温度、气压、湿度保持为常数。对与夸克的色荷转移相关的规范对称来说,需要的力不是别的,正是强力。就是说,如果没有强力,物理学在上面说的色荷转移下会发生改变。这一发现表明,虽然引力和强力有许多不同的性质(回想一下,引力比强力弱得多,而作用范围却远得多),它们确实还有某种相同的特征:它们的存在是为了让宇宙享有特别的对称性。而且,相同的论证也适用于弱力和电磁力,它们的存在关联着另外的规范对称性——所谓的弱与电磁的规范对称。因此,四种力都直接联系着对称性原理。
四种力的这个共同特征预示着我们在这节开头的建议是很有希望的。那就是,为了把量子力学融入广义相对论,我们应该寻找一种引力的规范场理论,就像物理学家已经发现了的其他三种力的成功量子场理论一样。近些年来,这个思想激励了一大批有名的物理学家满怀热情地踏上寻找之路,但一路上困难重重,还没有谁走到尽头。我们来看那是为什么。
广义相对论与量子力学
广义相对论适用于巨大的天文学尺度。在那样的距离,爱因斯坦的理论说明,没有物质意味着空间是平直的,像图3.3画的那样。为了把广义相对论与量子力学融合起来,我们现在必须转移关注的焦点,去考察空间的微观性质。在图5.1中,我们说明了如何一点点去暴露越来越小的空间结构。开始的时候,看不出什么来;看图中底下的三层,空间结构几乎是一样的形态。从纯经典的立场看,我们以为这样平直稳定的空间图景会一直保持到任意的距离尺度。但量子力学完全改变了这种想法。万物都摆脱不了不确定性原理所规定的量子涨落——引力场也不例外。虽然经典理论认为虚空间没有引力场,但量子力学证明,引力场尽管在平均意义上等于零,实际上却因量子涨落而波荡起伏。另外,不确定性原理还告诉我们,关注的空间越小,看到的引力场起伏越大。量子力学展现了一个没有绝望的世界,越是狭小的地方,越是浪花飞溅。
图5.1 逐级放大空间区域,显露它的超微观特性。为了融合广义相对论与量子力学,我们将在最高的地方面对汹涌的量子泡沫
引力场通过空间的弯曲表现出来,而量子涨落通过周围空间越来越强烈的扭曲表现自己。在图5.1中我们看到那种扭曲隐约出现在第四层。向更小的距离尺度逼近,我们会在第五层遇到随机的量子力学波动,那里的引力场表现出极强烈的空间弯曲,一点儿也不像我们在第3章画过的弯曲的橡皮膜。实际上,它像图顶那样,到处是混沌的卷曲。惠勒发明了一个名词量子泡沫来描绘这种超微的空间(和时间)里表现出的混沌状态——它描绘了一幅陌生的图画,传统的一些概念,如左和右、前和后、上和下(甚至过去和未来),都失去了意义。还是在这样的小尺度上,我们才发现广义相对论与量子力学原来是不相容的。广义相对论的核心原理——光滑的空间几何的概念——被小距离尺度的量子世界的剧烈涨落破坏了。在超微尺度上,量子力学核心的不确定性原理与广义相对论核心的空间(以及时空)的光滑几何模型是针锋相对的。
实际上,那矛盾是很具体地表现出来的。把广义相对论和量子力学融合起来的所有计算,都得到一个相同的答案:无限大。这是一个当然的信号,告诉我们做错了事情,该让老师打手掌心了。[4]广义相对论的方程平息不了量子泡沫的喧嚣。
不过,应该看到,当我们回到寻常尺度(在图5.1中从上往下看),小距离尺度上剧烈的随机涨落会平息下来——像那位被迫借钱的人把钱还了,银行的账户没留下借钱的痕迹——这时,宇宙结构的光滑几何学又变得精确了。我们有过这样的经历:从远处看到的一幅色彩均匀光亮柔和的图画,走近一看,却跟光滑的画面大不相同,原来它不过是一点点色斑,每一点都是分离的。但是你得注意,只有在离图很近,一点点地看,你才会发现它原来是离散的;而从远处看时,它是光滑的。同样,除了在超微观的尺度下,时空结构都表现得很平坦,这也是为什么广义相对论在足够大的距离(和时间)尺度——与许多典型的天文学问题相关的尺度——能做得很好,而在小距离(和时间)尺度上却产生那么多矛盾。广义相对论核心的光滑和轻微弯曲的几何图像,在大尺度上证实了;但在推向小尺度时,却被量子涨落破坏了。
广义相对论和量子力学的基本原理使我们能够在某个很小的尺度上进行计算,不过,低于那个尺度时,图5.1里的可怕现象会表现得很明显,计算不能再往前走了。因为标志量子作用强度的普朗克常量太小,描写引力本来强度的引力常数也太小,它们构成一个更小的几乎难以想象的普朗克长度:十亿亿亿亿分之一(10-33,小数点后面32个零)厘米。[5]图5.1最高层描绘的就是在普朗克长度下的超微观的宇宙景观。为了对那尺度有一个具体的认识,我们想象,把一个原子放大到我们的宇宙尺度,那么普朗克长度也不过是一棵普通的树的高度。
于是我们看到,广义相对论与量子力学间的冲突只是发生在宇宙相当隐蔽的地方;因为这一点,你当然可以问,那些问题值得去忧虑吗?有些物理学家也很明白那个问题,但他们还是在研究需要的时候,在典型尺度远远超过普朗克长度的问题上,快乐地运用广义相对论和量子力学。而另外一些物理学家则深信,我们那两块物理学基石根本就搭配不起,并不因为超微观的尺度才暴露了问题。他们认为,这个矛盾指出了我们对物理宇宙认识的根本缺陷。这种看法源于一个不能证明然而深入人心的世界观:如果在最深最基本的水平上认识宇宙,宇宙应该能以一个各部分和谐统一、逻辑上连贯一致的理论来描述。不论那矛盾对各人的研究是不是根本性的,有一点是肯定的,那就是,大多数物理学家很难相信,我们对宇宙最深层的认识的理论基础是由两个虽然有力然而搭配不起的数学框架拼接起来的。
为了能让两个理论协调起来,物理学家做过大量的尝试,他们以这样那样的方法,要么修正广义相对论,要么修正量子力学;虽然一次次的努力通常都胆识惊人,但结果却是一个失败跟着一个失败。
终于,超弦理论来了。[6]