5.突破维数的疆界
爱因斯坦的广义相对论,成功地用几何将惯性、引力,以及时间、空间统一在一起。这给了物理学家和数学家很大的启发,都想扩展和延续这种想法。大家首先想到的是,能否将电磁场也统一进来?这其中也包括了爱因斯坦自己,以及他为之奋斗后半生的统一场论。
统一理论所追求的,本来就是美妙的数学形式。相对论将时间空间统一成四维,以解决引力问题。如果要求得更大的统一,势必要再次突破维数的疆界,使用更高维空间的概念。我们在此先简单介绍一下爱因斯坦引力场方程以及几个与四维时空(或更高维空间)有关的数学概念。
(1)标量、矢量和张量
爱因斯坦广义相对论的中心是引力场方程。引力场方程是一个张量方程。张量的概念是矢量概念的扩展,学过中学物理的人都知道标量和矢量。标量是只用一个数值就能表示的物理量,比如温度、面积、体积这些量。矢量是既有大小又有方向的物理量。空间的一个矢量需要3个数值来表示,比如说,力、速度、加速度、位移等,都是矢量。如果将矢量的概念再推广,某些物理量需要更多的数值来表征的话,就被称为“张量”。或者说,三维空间中的标量是0阶张量(1个值),矢量是1阶张量(3个值),推广下去,三维空间中的2阶张量就需要(9个值)来表示。
图1-5-1中显示了各阶张量。气象预报时报告的某一时间的温度只有一个数值,是0阶张量,用3个数值表示的矢量则是1阶张量。某些物理量需要用9个数表示,是2阶张量,实际上也就是一个3×3的矩阵。此外,还有3阶以及更高阶的张量。
图1-5-1 阶数不同的张量
图1-5-1所举的是三维空间中张量的例子。相对论中,时间和空间被统一在一个四维的闵可夫斯基时空中,三维空间的张量也代之以四维空间中的张量。四维空间中的0、1、2、3阶张量分别需要1、4、16、64个数来表示。比如说,一个物体的动量,原来是三维空间的矢量,用3个数值来表示,它们分别是动量在x, y, z3个方向的分量:px, py, pz。动量等于速度与质量的乘积。在四维时空中的动量应该有4个分量,也就是说,对应于时空坐标(t, x, y, z)的动量矢量成为(p0, px, py, pz),其中的(px, py, pz)是原来动量的3个空间分量,对应于时间坐标的p0又是什么呢?它正好等于一个粒子的总能量除以光速c:(p0=E/c)。这里的总能量E又是什么呢?除了粒子的动能之外,还包括粒子在静止状态的总能量E0。因为爱因斯坦在狭义相对论中得到过一个著名的质能关系式:E0=m0c2。只要有静止质量m0,就有与其相对应的一份能量。因此,四维动量的时间分量(p0=E/c=m0c),与物体的质量和能量有关。
除了四维动量之外,原来三维空间的所有矢量(或者高阶张量)都有可能扩充到四维,至于与时间相关的那些分量所代表的物理意义是什么,就要具体问题具体分析了。比如电磁场中的磁矢势和标量电势,构成一个统一的四维电磁势A,今后我们便使用这个四维势:
(2)度规张量
现在我们可以举出一个2阶张量的例子:度规张量。
度规,就像是量度空间大小的一把尺子,用它来度量空间中的弧长(或称“距离”),可以写成一个2阶张量,也就是看起来像一个矩阵的形式。欧几里得空间的度规表达式很简单,可以从勾股定理得到。在上一节的图1-4-3中,我们实际上已经使用了二维欧几里得空间的度规(ds2=dy2+dx2),和二维闵可夫斯基空间的度规(ds2=dt2-dx2)。这里的s就是弧长。图中所示的矩阵,就分别是两种度规的矩阵表示。
一般的n维黎曼流形上的弧长平方如何计算呢?将上面两种度规表示推广一下,可以表达为一个一般的二项式:
注意,这里使用了一上一下的重复指标i和j,意思是表示对i和j从1到n求和。用上下指标重复来表示“求和”,而省略了求和的符号,使得表达式看起来简单明了,这是理论物理学中的一种约定,被称为“爱因斯坦约定”。
式(1-1)中的gij便是度规。指标i和j可以取不同的数值。比如说,在三维空间中,因为两个指标都可以取3个不同的数字,所以度规便有9个数值。这意味着,一般来说,三维空间的弧长平方(ds2)可以写成如下形式:
ds2=gxxdx2+gxydxdy+gxzdxdz+gyxdydx+gyydy2
+gyzdydz+gzxdzdx+gzydzdy+gzzdz2
度规的一般形式看起来挺复杂的,但读者不必害怕,我们一般不会使用它,你只需要知道度规是像上面那种求和形式就可以了。并且,如果对于平坦三维空间的直角坐标,矩阵所有交叉项都为0,3个对角项都为1,表达式就成为简单的勾股定理的三维形式。这里我们写出它的一般形式,是因为在广义相对论中,空间一般不是平坦的,也不一定使用直角坐标。因而,度规张量,或者说是从度规计算出来的“曲率”,可以用来度量空间的弯曲程度。如果我们考虑四维“时空”,度规张量所包含的数值就更多了,不止9 个,应该有16 个值。并且,正如我们在介绍闵可夫斯基空间,解释图1-4-3时所强调的,包括了时间维的“空间”,具有一些特别的性质。比如,那种“空间”中的“距离”,不一定是正数,可以是正、负、0,根据两个事件之间的关系是类时、类空或者类光而决定。广义相对论中,除了仍然必须记住上述概念之外,还需记住“时空”可能是不平坦的、弯曲的,度规张量gij有16个分量,也许很复杂。
(3)爱因斯坦场方程
求解任何方程的目的,都是从某些已知条件,得到未知函数。对广义相对论场方程而言,已知条件是空间的物质分布,未知函数就是刚才介绍的时空的“度规”gij。
爱因斯坦场方程的右边描述空间的物质分布和能量分布,用一个称为“能量动量张量”的数学形式表示。另外一边是时空的几何性质,用黎曼几何中的曲率张量表示。图1-5-2(a)中所示的就是爱因斯坦场方程,两边都是2阶张量。也就是说,爱因斯坦场方程看起来如同一个矩阵方程。方程右边的G是万有引力常数,T是系统的能量动量张量。左边的矩阵R与时空的曲率有关,即与时空的度规张量gij有关。场方程的意义就是对于系统中给定的质量分布,计算空间的弯曲情况。能量动量张量T包括了系统中(或宇宙中)所有的物质和能量,也可以包括电磁场。
图1-5-2 爱因斯坦场方程
既然电磁力可以作为能量动量张量的一部分被考虑进场方程中,是否意味着爱因斯坦场方程已经将电磁作用统一起来了呢?事实并不如此,因为将电磁场包括在能量动量张量中,只不过是将它像普通物质一样地考虑了它产生的引力效应,只不过使得最后得到的场方程的解所描述的时空弯曲中也包括了电磁场能量的贡献,但并没有涉及电磁场对带电粒子的电磁作用。换言之,能量动量张量中包括电磁能量的做法与麦克斯韦方程无关。
如何扩展广义相对论时空的几何范围,才能将麦克斯韦方程与引力场方程统一在一起?显然,维数在这里是一个限制。大家都知道,我们生活的空间是三维的,加上一维时间,不过是四维而已,是否能够找一个额外的空间来容纳麦克斯韦方程呢?
(4)五维空间
德国数学家西奥多·卡鲁扎(Theodor Kaluza,1885—1954年)提出一种将四维空间增加到五维的办法来统一引力场和电磁场。
引力场的方程建立在四维空间的基础上。在数学上,空间的维数n没有限制,可以是任何正整数,表示需要n个数值来决定这个空间中一点的位置。比如说,我们的物理空间是三维的,需要3 个数值来决定我们在其中的位置,这3 个数值在数学公式中可以写成(x,y,z),在地理上可以写成经度、纬度、高度,这是维数在物理上的意义。相对论将时间作为另外的一维,和3个空间维组合在一起,构成四维时空模型。这只是构造物理理论之需要,并非唯一的道路和方法。也就是说,如果不使用闵可夫斯基四维时空的方法,而仍然将空间和时间分开看待,但只要不忽视它们之间的内在联系,即洛伦兹变换,也一样可以建立相对论,得到同样的结果。但是,那样得到的理论,描述和计算均会很复杂,公式写起来也可能会不对称、不漂亮了。
因此,总结上面的观点,使用统一的四维时空,是为了建立数学模型的需要。时间和空间虽然是不同的物理对象,具有不同的物理本质,但是它们互相关联。将它们统一在一个数学空间中,能够更方便、简洁地表现它们之间的内在联系,体现数学美。并且,相对论将时间和空间统一在一个框架中,让理论看起来漂亮,并不只是为了满足数学家和理论物理学家的“美感”,也不仅仅是为了计算更简单,最终目的还是为了更深入地理解物理规律之间互相联系的内在本质,更容易发现新的自然规律,发展再下一层次的理论。这也就是理论“统一”的意义所在。
那么,为什么一定要将电磁作用和描述引力的时间空间统一在一起呢?引力场方程和麦克斯韦方程不是分别工作得好好的吗?我们也可以类比于相对论来寻求这个问题的答案。时间和空间在物理上是完全不同的,统一起来处理是因为它们之间具有紧密的内在联系。电磁现象发生在时空中,也应该与时空有紧密的内在联系,将它们与时间空间统一在一个数学空间的框架中,有利于探索发掘它们之间更多更深刻的内在联系,发展新理论,预测新现象。
引力理论将我们的三维空间世界和一维时间都用光了。因此,为了将电磁作用类似于引力场那样被几何化,卡鲁扎在四维时空的基础上加上了额外的第五维,来容纳与电磁场有关的变量。
增加维数是什么意思呢?不过只是增加了表示某个事物所需要的变量数。从这个意义上来说,我们在日常生活中其实也经常和“高维空间”打交道。记录一个新生儿出生时的情况,3个数值是远远不够的,除了他的出生地点、年、月、日、时刻之外,还有体重、身长、血型、心跳快慢、呼吸次数等许多数据,这也就算是数学上的一个多维空间,每一维都有其物理意义。
那么,回到卡鲁扎的第五维空间,它表示的物理意义是什么呢?根据卡鲁扎的建议,可以将广义相对论使用的四维时空上,加上一个额外的空间维,这一维代表电磁场,应该与电荷q,或电磁势A有关系,其中还包括了一个额外的标量场ϕ,这个标量场所对应的粒子被卡鲁扎称之为“radion”,见图1-5-3。
图1-5-3 卡鲁扎—克莱因第五维理论
根据这个五维时空的构想,卡鲁扎可以得到好几组方程式,其中包括等价于爱因斯坦场方程的一组、等价于麦克斯韦方程组的一组,以及关于标量场ϕ的方程。后来,瑞典物理学家奥斯卡·克莱因又将此理论纳入量子力学,由此建立了卡鲁扎—克莱因理论。
如何解释理论中的第五维这个额外维度?卡鲁扎和克莱因认为,我们不能看到第五维空间,是因为它卷曲成了一个很小的圆。这个新颖的想法开了多维空间之先河,是第一个高维宇宙的模型,影响了之后的物理学家们建立标准模型时关于额外维度的几何构想。
如1-5-3(c)所示,第五维就像是在原来的四维时空(图中用平面的二维时空网格代替)中,加上了一些极小的圆圈,这些圆圈的尺寸太小时,我们就感觉不到它的存在。就像在现代的纺织机器织出的某些纤维布料中,我们看不到一些非常小的圈形纤维结构一样。物理学家计算出了这些圆圈的大小,只有约为10-30cm的数量级。
从后来发展的规范理论来看,类似圆圈的第五维可以被理解成复数平面上的旋转。实际上,电磁理论就是对应于复数平面上的旋转,这是电磁场与量子化的电子场相互作用的关键模型,后来被推广到杨—米尔斯理论等。如今弦论数学模型中的空间是十维的,后来演变成十一维空间的M理论,都是源自这个五维模型的推广。爱因斯坦曾经思考过卡鲁扎—克莱因理论,事实上卡鲁扎最原始的论文就是在他的支持和推荐下得以发表的。但爱因斯坦最终放弃了这个思想,没有在这条路上走下去。