显示标签为“且来悟理”的博文。显示所有博文
显示标签为“且来悟理”的博文。显示所有博文

2011年5月24日星期二

精神病院隔壁的n次元世界

我已不记得自己在什么年纪时知道空间有三维,我也不清楚什么岁数的心智才足以理解“维”的概念——当然,是在直观的意义上。我只记得读小学时,同学的文具盒上印着“四维空间”四个字,我似乎还拿着这个文具盒去请教过数学老师。无论如何,对于有一点科学常识的成年人来说,理解我们所处空间的维数并非难事:空间有三维。如果把时间也算进来——虽然这会让大多数人感到别扭——可以说,我们生活于四维的时空。

可是对于住在精神病院隔壁的理论物理学家来说,想象着这个世界有更多的维数已经是家常便饭。的确,从第一个有意义的多维空间模型的诞生到今天,已经过去了九十年。我们都知道,Einstein于1915年左右建立的广义相对论将万有引力归结为时空的弯曲。而从德国数学物理学家Kaluza与Einstein的通信可知,不迟于1919年,前者就已将此几何化的世界推广到五维时空[1]。作此推广的动机是统一场论:与我们四维时空的弯曲导致万有引力类似,让第五维空间的弯曲解释电磁力,那么万有引力与电磁力就优美地获得统一。

“可我们的世界明明只有四维呀?”——这是额外维模型遇到的第一个麻烦。很快,1926年,瑞典理论物理学家Oskar Klein给出了解决方法:将那多出来的一维卷起来即可[2]。这背后的常识是,从远处看去,一根头发是一维的物体。可是更仔细一点,比如用显微镜看,你会发现,发丝也有粗细,因此其表面仍然是二维的。只是,那一维实在“太小”,在远处看去无异于不存在。与此相仿,只要时空的第五维卷得足够小,小到通过显微镜都看不到,那么人们平素所见的世界就仍然是四维的时空。

这就是著名的Kaluza-Klein理论。构造在此基础上的额外维模型,至今仍是基本粒子理论的热门候选者,并且有望在近期内由实验检验。不过这些还不是本文的重点。因为,我们希望离精神病院更近一些。毕竟,理论物理学家最擅长的事情就是得寸进尺:既然可以有一个额外的维数,为什么不能有两个、三个或者更多呢?

在弦论中,维数并不是预先给定的量。1971年,Lovelace第一次发现[3],弦论中散射振幅的解析性要求时空的维数是26。这个数字在加入了超对称的弦论中变成10。然而无论是26维还是10维,如果人们指望这些理论能够描写现实世界,那么多余的维数都得在一个很高的能量尺度上被卷起来——请回忆,在相对论性的量子理论中,高能量对应于短距离。因此,额外维若存在,则必然出现在极其微小的尺度上。这也就是为何它们会影响到微观世界的粒子物理,却不会毁灭生活世界中人所共知的常识——你只需想想头发丝即可——维数总是随着能量尺度的升高而变大,无论在最初的Kaluza-Klein模型中,还是超弦理论中。

然而,这并非故事的全部。

2000年左右,几位物理学家在圈量子引力和Regge calculus的启发下发明了一种处理量子引力的数值方法,称为causal dynamical triangulation(CDT,因果性动力学三角剖分)[4]。其大致方法是,将时空作三角格子剖分,在此网格上加以一定的限制(如保持因果性等),然后研究格子本身的演化。如果你需要一个图像来理解这一点,可以想象水立方。人们希望通过此类数值计算跟踪量子引力的蛛丝马迹。CDT最引人注目的结果是,时空在Planck能标[5]变成了2维。并且,随着能量从Planck尺度下降到日常生活的尺度,维数由2渐渐升至4。注意,恰恰是在Planck尺度,量子引力效应起主导作用。因此可以说,量子引力生活在二次元的世界。


请注意,这幅图像与Kaluza-Klein模型是相反的:维数随着能量尺度的上升而下降!头发丝的类比在这里失效了。人们自然会问:这个二次元的世界究竟是指什么呢?如果没有“卷起来”的机制,那么又是什么机制保证2维的量子引力世界能退回到4维的世界呢?

可惜目前并没有理解这一点的直观图像,甚至也没有明确的机制能够解释,这个维数的变化是如何实现的。由于CDT是一种数值方法,它在提供答案的同时并不提供对答案的理解。

可以确知的是,这里的维数必然与我们通常所理解的维数很不一样。我们在经典或量子物理中所提到的维数,通常依赖于线性空间的结构。而CDT的世界是一个三角剖分的网格世界,其中没有通常意义下的线性结构。实际上,CDT所谓的维数实际是指“谱维数”(spectral dimension),这是从扩散过程中分布函数对时间依赖的幂次行为中提炼出来的概念。直观上,我们知道,对于相同的面积,离太阳越远,接收到的热量就越少,这个随距离减少的函数满足平方反比律。为什么是平方反比?——因为,所有以太阳为中心的球面都接受到相同多的热量,而这些球面的面积正比于球半径的平方,因此单位面积的热量按平方反比被稀释。仿照类似的推理,你会发现,在其他维数下,随距离按-2次方衰减的规律不再成立。你也可以找到此时代替-2的新的指数,并给出这个指数与时空维数的关系。根据此关系,知道了维数即可求出衰减指数,反之亦然。

这就是定义“谱维数”的出发点。虽然对扩散过程的讨论略有不同,但其精神是一致的。在CDT中,计算结果的确给出了分布函数随尺度变动的扩散指数,这就暗示了时空本身的(谱)维数在发生变化。

不过,比头发丝类比的失效更挑战直觉的结果是,这里的维数是连续变化的——可是维数难道不应该是整数吗?整数又如何连续变化呢?

虽然目前对维数变化的过程缺乏足够的理解,但人们已有了一些初步的尝试。最容易想到的解决方式当然是分形,即分数维的几何对象。分形在日常生活中无处不在:血管,河流,树枝,海岸线——它们都具有近似的分形结构。自然,这里的维数也不是线性维数,而是Hausdorff维数。

“分形”(fractal)一词提出于1975年,而就我所知,构造分形时空中的量子场论在上世纪80年代就已开始。然而这还不能满足我们的需求——分形的维数虽不是整数,却是一个固定的值,而我们所需要的维数,不仅仅是非整数,而且还要随着尺度跑动。不过,这样的结构在数学中也有对应,人们称为“多分形”(multifractal)。近两年,也有人尝试构造多分形上的量子场论,目前仍处在起步阶段。顺便一提,2009年大热的Horava-Lifshitz理论,在一定意义上也能复现CDT的结果,即Planck尺度下谱维数趋于2。

尽管理论上这一切还不甚明了,但很快已有人将其应用到现象学研究。今年2月份,Stojkovic的一篇文章[6]指出:如果时空真的在高能时变成3维、甚至2维,那么在不远的将来,人们即可通过粒子物理实验或者宇宙学观测检验之。比如,如果在某一个能量尺度下时空是3维的,则不存在相应频率的引力波——因为引力场在3维时空中没有传播的自由度。于是,宇宙早期原初扰动所产生的引力波必有一频率的上限。经过上百亿年的膨胀,这个频率已经红移到了引力波探测实验(如LISA)可以触及的尺度。

作此预言的条件是,时空从4维降至3维的尺度发生在TeV能量附近——这听上去难以置信,因为目前的粒子物理实验已经可以进入此能区,却没有明显的结果表明TeV尺度的时空是3维的。然而,该文作者声称,从宇宙线观测中,人们已经发现了TeV尺度上维数减少的迹象。看来,物理学家不仅自己很疯狂,还善于将这个世界变得和他们一样疯狂。

作为结束,我们顺便指出一个已有的暗能量模型[7]。该模型鼓吹,虽然我们的时空是四维,但在宇宙的尺度上是五维。我们再提到,量子引力的强耦合极限[8]指出,在远高于Planck能标的区域,所有空间维数将被冻结,只剩下1维时间。现在,整合所有这些图像,我们终于民科般地发现了一条伟大的存在之链:从远小于10的负35次方米到大至10的26次方米的广袤世界中:时空的维数从1经过2、3、4,直至5。我们人类,恰好存在于4维时空的尺度上。这,可以用《圣经》与《道德经》的结合以描述:

太初有道:道生一,一生二,二生三,三生万物。


-----------------------------------------------------------
[1] J. Dongen, arXiv:gr-qc/0009087v1 (2000),
[2] O. Klein, Nature, 118, 516, Z. Phys., 37, 895, (1926),
[3] C. Lovelace, Phys. Lett., B34, 500 (1971),
[4] See, e.g., J. Ambjørn, Phys. Rev. Lett., 95, 171301 (2005),
[5] Planck能标大致在10^28 eV;作为对比,核反应的能量级大致是10^6 eV,化学反应的量级大致是0.1eV,
[6] J. Mureika and D. Stojkovic, Phys. Rev. Lett. 106, 101101 (2011),
[7] G. R. Dvali, G. Gabadadze, and M. Porrati, Phys. Lett. B 485, 208 (2000),
[8] 参见此前的日志:《让光线飞》,《关于上一篇日志“让光线飞”的技术性附注》.

2011年4月13日星期三

对称性闲话(续)

在上篇日志结束的时候,我们得到这样的印象:没有理由认为经验世界中的对称性是严格成立的,因为我们甚至并不知道在经验世界中“严格”是否有意义。而另一方面,凡是可被经验的对称性一定可以被可观测的物理效应所破坏,否则,我们将无法通过经验判断这种对称性是否起源于语言的冗余。

为了更好地理解这个陈述,让我们考虑一个“完美的球体”。教科书给予我们的成见是,人们称这个球体具有球对称,是因为它在旋转变换下保持不变。可是,仔细考虑之后,你会发现,为了定义旋转变换,我们得预先在球上画好经线和纬线,也就是建立球面上的坐标系。通过指定经纬网格位置的变化,我们才能说对球体施加了一次旋转变换。

建立球面上的坐标系,这在理论上没有困难。真正至关重要的问题是,这个球体是否允许我们用一支记号笔在它的表面上将这个坐标网格画出来?——言下之意,我们是否可以“物理地”破坏球体的球对称?

如果这个问题的答案是否定的,也就是说,如果动用一切手段都无法确知这个球究竟是否发生了转动,那这将意味着,该球体的任何位形在物理上都是等价的——请注意,这是一个相当挑战直觉的情形。因为在此时,我们无法确知这个球是否发生了绕球心的转动,从而,其自转角动量将是不可测量的——你瞧,这是一个彻底的经验主义者必然会得到的结论。


实际上,从日常生活也能发展出类似的但不那么挑战直觉的例子——考虑镜子中的像。请站在一面镜子前,设想它是无穷大的平面镜,暂时忘掉所有关于平面镜成像原理的光学知识,暂时忽略所有我们世界中的所有手性。(这里的手性是指,绝大多数人心脏都在左侧,参与生物活动的葡萄糖都是右旋(D构型),我们看到的中微子都是左手,等等。)此时,你所面对的世界就是一个具有镜像对称的世界。并且,动用一切物理手段,你都无法区分镜子的里和外,因为赖以作此区分的手性已经被我们忽略了——现在,你怎么知道自己不是镜子那边的你的像呢?换言之,我们将无法通过观察判断出一个物理过程究竟发生在镜子的哪一边。

所以我们有时也会见到这样的表述,即:对称性就意味着不可观测量的存在。

而我倾向于将这种情形下出现的对称性都叫做“规范对称性”。极其粗略地讲,规范对称性是非物理的对称性。这里的“非物理”应在存在着不可观测量的意义下理解。

明白了这些,你可以很快举出各种规范对称性的例子:能量零点的任意性(这里暂且不考虑引力);量子力学中波函数相位的任意性;全同粒子编号间的交换对称性,等等。它们都和某些不可观测量相连。

不过为了避免误解,需要注意的是,当人们提到规范理论的时候,多数情况是指连续局部规范对称性。那些与基本相互作用相关的对称性即属于此类。

为理解基本相互作用中的规范对称性从何而来,让我们考虑一个简化的图像。一般而言,相互作用由无质量的、自旋为1(即螺旋度为1)的粒子传递。在3+1维时空中,这种粒子只有两个独立的极化方向(比如,光只有两个独立的偏振方向)。而量子场论中,与这种粒子的对应的量子场是矢量场(即规范场),它在3+1维时空中有4个独立的极化方向。这四个极化中,有1个对应于自旋0,3个对应于自旋1。如果用这三个自旋1的极化分量去描写一个本身只有两个独立极化的自旋1粒子,显然会多出来一个。这个自由度在描写零质量自旋1的粒子时没有任何对应——它就是规范对称性的来源。这个图像之所以是简化的,是因为我们略去了规范场自身的相互作用。用行话来说,后一种情形对应于非阿贝尔(non-abelian)规范场。

量子场论是一个局域的理论,在每个时空点上,场量的自由度都有冗余,因此相应的规范对称性在每个时空点上分别存在,这就是局域规范对称性中“局域”一词的所指。它意味着此时的规范对称性是非常大的。对于电磁场来说,这可以很不严格地写成U(1)×R^4。这样大的对称性会对系统的Hilbert空间带来本质的影响。如若这种对称性被破缺,后果很严重。所以,人们一般倾向于认为这种对称性是严格的(因为它的确来自语言的冗余),而那些整体对称性,包括上篇日志中提到的Lorentz对称性,一般是近似的(因为它们毕竟是物理世界真实的对称性)。

有人也许会对我们语言的冗余耿耿于怀,他们会问:倘若改用一种精炼的语言去描述我们的理论,是否就可以避免这种冗余、继而将规范对称性从我们的字典中驱逐出去呢?——这当然可以,但是要付出代价。就上面提到的规范场论,代价是:或者破坏时空对称性、或者容许鬼(ghost)的出现。其中,前者自然是人们不希望的,而后者是否会使人感到头痛,取决于你是否怕鬼。在规范场论的现代版本中,人们已经能够很好地理解鬼并控制它。我们在Hilbert空间中辟出一片空地专门供它们游荡,同时也能阻止它们出现在描写真实世界的区域中。这在场论中叫做BRST方法——四个字母分别来自四位物理学家的姓名。

至于为什么避免语言的冗余就可能破坏时空对称性,这可以用一个比规范场论简单地多的模型来理解:考虑一个点粒子在时空中的运动。我们知道,自由粒子沿测地线运动。对此可以用两种方法描写之。一是参数方程。取参数为s,在3+1维时空中,这相当于方程组t=t(s), x=x(s), y=y(s), z=z(s)。这个理论自然具有一种规范对称性——参数的任意选取不改变物理。同时,这种描述还是Lorentz协变的——在Lorentz变换下上面的方程组形式不变。此时的规范对称性的确是局域对称性,因为重参数化可以由函数s’=s’(s)在测地线上逐点确定。同时,它的确来自与语言的冗余:即出现了多余的参数s。如果我们从上面的方程组中将它消去,并得到一组新的方程:x=x(t), y=y(t), z=z(t),语言的冗余自然消失,但方程的Lorentz协变性也随即消失。

2011年4月6日星期三

对称性闲话一则

(按:顾颖飞同学在“饥渴乐园”开了一个物理讨论小组,要我为他的“对称性”专题写点东西。他认为我之前的日志对低年级同学不够科普,故有此文。当然,这不意味着我对读者的物理背景没有任何假设。)

无论如何强调对称性在现代物理学中的作用都不过分。这不难理解:物理的目标之一似乎就是恰当地将纷繁复杂的自然现象约化为简单的规律。而对物理理论的审美态度大概正是来源于这种约化过程与艺术活动的相似性。在此过程中,对称性恰恰是一种约化现象的快捷方式,因而极容易激发人们的灵感,无论是科学的还是艺术的。

然而在这里继续解释什么是对称性将显得冗余,因为已经有太多介绍对称性的初级读物了,且其中不乏大师的精彩之作,而我不认为自己会比他们解释得更好。所以让我们以经验主义的姿态快速进入具体问题。

对于单个物体来说,对称性的存在容易确证。比如,观察一粒食盐晶体(如果能买到的话),你能发现某种对称性,尽管是近似的。事实上,如果仅仅关注这类例子,在现实世界中大概是没有完美的对称性。即使是实验室中磨出来的号称世界上“最圆的”硅球
,(图1)也不会完美。


(图1:为了更好地定义“千克”所磨制的硅球,号称是世界上最圆的球。即使如此,它也不是完美的。)

可是在理论物理中我们时常见到“时间平移对称性”,“空间平移对称性”之类的短语。初看上去这似乎荒诞不经:如果这个世界真是时间平移不变的,那房价自然是不会涨了,炒股也会变得无聊……继续想下去,不难发现,这样的宇宙将会变成一团均匀且永恒的浆糊。

于是,我们究竟是在怎样的意义上讨论“空间平移对称性”呢?惯常的回答是“物理规律”的对称性。亦即,描写物理对象的运动方程在“空间平移变换”的作用下保持不变。或者更严格一些,系统的作用量在对称性的变换下应该保持不变。可是,直接描写物理世界的,并不是运动方程本身,而是运动方程的解——它当然可以不是平移不变的。

如果可见世界并非平移不变,那我们如何知道它显现的物理规律是平移不变的呢?最简单的回答,是动量守恒。台球间的碰撞就是很好的演示(图2)。通过台球碰撞和行进的方式,我们判断出物理规律应当是平移不变的。当然,这也是在近似的意义下成立的:你需要忽略台球和桌面的摩擦、忽略碰撞时动能的耗散。如果需要的话,可能还得忽略台球与空气的摩擦。当考虑了所有可能产生耗散的因素之后,我们也许会下结论说,台球碰撞所遵循的物理规律是严格平移不变的。这与上面提到的食盐晶体仅具有近似对称性当然不同:时空平移的对称性似乎是更高级的对称性。


(图2:通过动量守恒,我们推测出物理规律的空间平移不变性)

可是这个回答另有玄机:是否存在不可排除的因素,导致时空对称性仍然像食盐晶体一样,只是近似成立的?的确如此。因为,“近似”是物理的内核,经验世界中没有“严格”的概念。事实上,在极大或极小的尺度,时空对称性都将遭到挑战。为理解这一点,只需注意到,我们为获知时空对称性(即Lorentz对称性)所依赖的动量守恒、角动量守恒须以惯性系的存在为前提。而在极大或极小的尺度,这都是成问题的。

在我们这个加速膨胀的宇宙中,并不存在全局的惯性系。简单地将狭义相对论的原理套用到这里会遇到麻烦。例如,我们的宇宙中的确存在一个“绝对参考系”——人们甚至可以通过观察宇宙微波背景辐射来测量我们银河系相对于这个绝对参考系的运动速度(图3)。所以,全局的Lorentz对称性在这里自然是不存在的。当然,你可以说狭义相对论在此失效;但如果以此回过头来攻击狭义相对论本身,那就很可笑了。




(图3:这是COBE卫星观测到的宇宙微波背景辐射。通过其温度分布的偶极行为,我们知道银河系相对于“宇宙的围墙”有非零的速度。)
  另一个极端是微观世界。就目前的理解,巨大的量子涨落将使时空在Planck尺度失去我们在日常生活中所经验到的连续性。黑洞在其中恰如沸水里的气泡一样不断产生和消失。当然,在这里讨论任何时空对称性是徒劳的。

人们甚至并不认为Lorentz对称性必须要到Planck尺度才失效。也许在目前实验可及的尺度,Lorentz对称性就会破缺。值得一提的是:量子场论中著名的CPT定理指出,一个场论在电荷共轭C、空间反射P和时间反演T的联合变换下是不变的。这个定理的证明须以Lorentz对称性为前提。因此,如若物理世界中CPT对称被破坏,那么Lorentz对称性也会破坏。事实上,在粒子物理中人们已经观察到了P破坏甚至CP破坏。看来CPT破坏只是一步之遥,Lorentz对称性也岌岌可危——只是这一步的大小仍未可知。这对于理论家来说十分重要:因为如何使一个本身破坏Lorentz对称性的时空在我们经验世界的尺度上将这个破坏巧妙地隐藏起来,在理论上也是一个困难的问题。

对于物理专业的同学,以上讨论未免过于老生常谈。可是对时空对称性的这种分析给我们两个提示。第一个提示是,但凡经验世界的对称性,在原则上都可以是近似的。换言之,没有任何先验的理由认为一种经验对称性应当严格成立。反之,如果物理理论中存在某种“严格”的对称性,那就很值得拷问这种对称性究竟是否是物理的。另一个提示是,我们能够经验到对称性的前提是,这种对称性一定能被可观测的物理效应所破坏。否则,如果运动方程和它的物理预言都具有这种对称性,那我们又如何知道这种对称性不是由我们语言的冗余所导致的呢?

可是物理理论中恰恰存在那种既在物理规律的层面上成立、也在可观测物理效应中满足的对称性——这就是规范对称性。以上文为基础,我希望能够解释清楚为何规范对称性是非物理的对称性。不过这篇日志已经足够长了,关于规范对称性的讨论,请容我下回再叙。

2011年2月26日星期六

关于上一篇日志“让光线飞”的技术性附注/外一则

昨天一位同学在人人网给我的留言使我意识到,有必要澄清一下上一篇日志《让光线飞
》中一个容易引起误解的问题。为了避免这篇日志沦为纯技术性的讨论,我会在最后加一个高中物理量级的小补丁。


《让光线飞》中提到的量子引力的强耦合极限,是一个很偏门的东西。最早意识到量子引力在远高于Planck尺度精确可解的文章,可能是Isham的文章[1]。后来也有人陆续研究这个问题,比如Kayoko Maeda和Makoto Sakamoto的文章[2],这篇文章研究了从那个精确解出发做正规化和围绕展开的问题。


这个强耦合极限基本的物理图像已如上篇日志所述。更技术一些的解释,是Wheeler-DeWitt方程在Planck长度趋于无穷大之后就变成了超定域的(ultra-local)方程。所谓超定域是指,方程中甚至不含关于时空坐标的微商,这也就表明任何场都是不传播的,于是整个宇宙被冻成一团。


有些对理论物理略有了解的同学有可能会将这个和著名的AdS/CFT correspondence混在一起。后者是指一个AdS5×S5空间上的Type IIB超弦理论(其低能极限就是一个超引力理论)与边界上Super Yang-Mills理论的等价性。通俗地说,量子引力可以非微扰地用一个规范的共形场论描写。这大概是20世纪90年代理论物理最重要的进展了。请注意这和上面提到的强耦合极限不是一回事。


----------------------------------------------


好了,让我们放松一下。


前两天有位同学和我聊到这样一个问题:单就一个原子来说,电子和原子核的电磁作用远大于万有引力。可为何对于太阳这个由很多原子构成的系统来说,引力竟然可以与电磁作用相抗衡而最终达到稳态?


我想这个问题的答案对于中国同学来说是一点也不陌生的。很简单:因为引力虽然弱,但总是吸引,万众一心,所以很和谐;而电磁作用虽然强,但总有人唱反调。有反调就必然要被和谐,所以电磁作用在长距离上是被屏蔽掉的。对吧?被屏蔽了。你若不信,可拿google或者twitter啥啥的做做实验,有观察才能有收获嘛。至于实验方案实验步骤,请自行设计。


----------------------------------------------


[1] C. J. Isham, Proc. R. Soc. London A351, 209 (1976)


[2] Kayoko Maeda and Makoto Sakamoto, Phys. Rev. D54, 1500 (1996)

2011年2月25日星期五

让光线飞



不论有多离谱,三人总能成虎。重复一千遍就成为真理,这不仅是谎言传播的经典模式,同样也是科学传播的标准套路。所以,物理中“惯性”这个词真是绝妙的概念:没有什么能比人习惯的惯性更大。

说到惯性,我相信有不少人会想过,在亚里士多德的同时代为什么没有诞生一个伽利略呢?给亚里士多德做一些自由落体实验、就像我们在中学课堂上看到的那些小把戏,那些所谓“力造成了运动”的论调不就不攻自破了吗?

问题当然没有这么简单,但也不难理解。只消注意到这个真理即可:没有什么能比人习惯的惯性更大。因此,再多的事实也不足以立刻推翻成见,因为在这些成见看来事实只不过是魔术。于是,科学知识(我避免使用“科学真理”这个词)的传播只能寻求与谎言扩散相同的路数了。

古代人很难理解,如若地球在高速自转,树上的苹果何以会竖直下落。你可以归咎于他们缺乏适当的生活经验,因为对于生活在今天的人们来说,理解这一点不再困难:只要在飞奔的汽车或飞机中抛一个苹果,分晓自见。

可见人们对自然地认识与他们的生活经验在一同演化(我也避免使用“进化”这个词),尽管这两者并不总是同步:比如,今天的人们都已知道,光速是每秒三乘十的八次方米,但我们同古人一样,在生活经验中对这一陈述的体认是相当匮乏的。这也就是为何狭义相对论对于初学者来说总会成为挑战直觉的利器。当然,一切的原因还在于光速实在太快了。假如我们能造出一半光速的飞机,事情就容易多了:你在飞机上会发现前面的天是紫的、后面的天是红的,然后,你下了飞机还得赶紧对对手表。所以,为生活所迫,你必须懂一点相对论。

相对论在我们这个低速的世界中显得如此离奇,大概是因为它有一种奇特的因果结构。与它相比,我们日常世界的因果结构就显得过于平庸了。为了下文的方便,我希望在此稍稍进入细节。进入细节的方法是使用“光锥”图。学过狭义相对论的同学对光锥当然不会陌生,不过为完整起见,还是让我来盗用《时间简史》中的一张图:



如你所见,将水波的图样按时间顺序依次排开,就得到了一个锥形,我们不妨称其为“水锥”。将水波换成光波,我们就得到光锥。显然,这个锥形斜边的斜率就代表了光速。

按照相对论,一切物理信号传播速度之上限即为光速。以此推理,你不难发觉,只有在该顶点之上、且处于光锥之内的时空点,方有可能接受到由原点、亦即光锥顶点处发出的信号——因为信号传播到锥形范围之外的点,需要比光速更快的速度,而这是相对论所不允许的。

光锥的确描写了一种因果结构。这句话的意思是,只有锥形内部的点方有可能与原点有因果联系。言下之意,位于锥形之外的时空点,即使在时间上出现于原点之后,今世也注定与原点无缘。因此对于锥外之点来说,其坐落的时刻在原点之前或是之后并无绝对的意义。事实上,倘若我们可以任意选取惯性参考系,就总可以将锥外一点的时间任意地变到原点之前或者之后。

在日常生活的世界中,光速可以被看成是无穷大。从光锥的角度看,当我们将光速变得越来越大时,这个光锥就越来越扁。若最终取到无穷大的极限,那些光锥就扁成了平面,如同《Tom and Jerry》被车轮碾过的猫。如此一来,因果结构就变得平庸了:在时间上位于原点之前(或之后)的点原则上与原点都可以有因果联系。

当你第一次读到这些异想天开的把戏时,一定会觉得够疯狂了。不过,何妨再疯狂一些呢?我们在上面讨论的是将光锥压扁的极限,或者叫让光速飞向无穷大的极限。反过来,为什么不能考虑另一种极限呢?如果将光锥收紧,让它变得像一根针那样,会发生什么呢?请注意,这种操作等效于将光速变慢。因此我们不妨问,光速趋于零的极限又是什么?

将光速变慢并不是什么新鲜事。早在1938年,伽莫夫(Gamov),就是鼓吹宇宙大爆炸的那位,在他的科普小说Mr. Tompkins in Wonderland中就已经玩过了类似的把戏。这在直观上也不难想象。你也许很快就会想到:如果“一切物体的运动速度都不得超过光速”这条禁令仍然管用,那低光速的世界就是一个乌龟和蜗牛的世界。如果可以更离奇一些,将光速趋于零,那这个世界就会被绝对地冷冻起来:整个宇宙将是一块真正的刚体,不论你信或不信,它就在那里,不生不灭。

听上去这是相当离谱了。然而它还没有离谱到与我们的世界没有任何关系。在以前的博文中我曾多次提到,当能量超过Planck质量(10的19次方GeV),或者等效地,当尺度小于普朗克(Planck)长度(10的负35次方米),现有的许多物理规律都将失效。归根结底,这是因为万有引力,不论是否需要量子化,在那里都将变得极不寻常。对于今天的理论物理学家来说,目前尚无可以用来处理量子引力的完整理论。普朗克能区的物理仍然是一片扑朔迷离,足以当得上“雾里”的大名。

可是故事并没有因此结束。关键在于,我们也许可以未得寸,先进尺——如果我们对普朗克能量的物理一无所知,那就不妨去考虑更高的能量。这相当于,探索比普朗克长度还要小得多的尺度,以至于10的负35次方米在此处都能被视作无穷长。

回忆普朗克长度的表达式:

(其中右端各量分别是普朗克常数、光速c和万有引力常数G),我们不难发现,如果希望趋于无穷,有两种招数:一是令万有引力常数G趋于无穷,而另一种则是令光速趋于零!而我们刚才的讨论表明,零光速极限下的物理将变得极其简单平庸,因此是可以精确求解的。绕过了普朗克能量的山重水复,世界在这里变得柳暗花明。这个精确解,物理学家们称之为“量子引力的强耦合极限”。

所以,纵使量子引力的硬骨头难啃,我们总算有了一种新的啃法;纵使普朗克能区易守难攻,我们也已对它们形成合围之势——当然,这不意味着我们可以很快拿下它。或许上帝还有足够的闲情逸致,在这里将三十六计给我们统统玩一遍。谁知道呢?如果一切尽在预料之中,岂不是太无聊了吗?

2010年10月14日星期四

波和量子【by Louis de Broglie】


(按:前两天开组会时说到了de Broglie。据某流传甚广的八卦称,de Broglie以两页纸的博士论文拿到了Nobel奖。这当然是误传。事实上他的博士论文很好找到,我从网上下载到的英文翻译有73页,因此原文几乎不可能是两页。倒是他在Nature上发表的文章只有1/3页,十分简洁,在今天看来应该是很好懂了。以下是一个大致的翻译,供有兴趣的同学参考。另外,从今天的观点看,物理专业的同学应该很容易找出文中的不少“错误”。但这其实并不意味着什么。相对于当初那些盖大楼的先辈而言,修正这些错误不过是搞搞装修罢了。)





Waves and Quanta
波和量子





The quantum relation, energy=h
×

frequency, leads one to associate a periodical phenomenon with any isolated portion of matter or energy. An observer bound to the portion of matter will associate with it a frequency determined by its internal energy, namely, by its “mass at rest.” An observer for whom a portion of matter is in steady motion with velocity βc

, will see this frequency lower in consequence of the Lorentz-Einstein time transformation. I have been able to show (Comptes rendus, September 10 and 24, of the Paris Academy of Sciences) that the fixed observer will constantly see the internal periodical phenomenon in phase with a wave the frequency of which 
  is determined by the quantum relation using the whole energy of the moving body------provided that it is assumed that the wave spreads with the velocity c/β

. This wave, the velocity of which is greater than c

, cannot carry energy.
量子关系,即能量=h ×

频率,引导人们将周期现象与孤立的一份物质或能量联系起来。相对一块物体静止的观察者将赋予该物体一个频率,此频率由物体的内秉能量,即“静质量”所确定。而若该物体对观察者作速度为βc

的匀速运动,则根据洛伦兹-爱因斯坦时间变换,观察者将发现该物体的频率降低。我已能够演示(巴黎科学院九月10日与24日的报告),固定观察者将通过波动的相位持续地观察到物体的内部周期运动。该波动的频率
由运动物体的总能量经量子关系决定——条件是,假设该波动以速度c/β

传播。此波动的速度超过光速c

,因此不能携带能量。


A radiation of frequency ν

has to be considered as divided into atoms of light of very small internal mass (<
gm.) which move with a velocity very nearly equal to c

given by 
. The atom of light slides slowly upon the non-material wave the frequency of which is ν

and velocity c/β

, very little higher than c

.
我们须认为一束频率为ν

的辐射由具有很小内秉质量(<
克)的光原子组成。由
可知,这些光原子以非常接近光速c

的速度运动。光原子在非物质波上缓慢滑行,而该非物质波的频率为ν速度为c/β

,略高于光速。


The “phase wave” has a very great importance in determining the motion of any moving body, and I have been able to show that the stability conditions of the trajectories in Bohr’s atom express that the wave is tuned with the length of the closed path.
“相波”对于确定任意运动物体的运动极为重要,我已能够演示,玻尔原子轨道的稳定性条件表达了波动按照闭合轨道的长度被调制的事实。


The path of a luminous atom is no longer straight when this atom crosses a narrow opening; that is, diffraction. It is then necessary

to give up the inertia principle, and we must suppose that any moving body follows always the ray of its “phase wave”; its path will then bend by passing through a sufficiently small aperture. Dynamics must undergo the same evolution that optics has undergone when undulation took the place of purely geometrical optics. Hypotheses based upon those of the wave theory allowed us to explain interferences and diffraction fringes. By means of these new ideas, it will probably be possible to reconcile also diffusion and dispersion with the discontinuity of light, and to solve almost all the problems brought up by quanta.
当原子穿过狭缝时,它的路径就不再是直的,因为会出现衍射。从而,我们必须

放弃惯性定律,并设想任何物体都跟随其“相波”而运动;在通过足够小的缝隙时,它的路径就将被弯曲。曾经,波动光学代替了几何光学;如今,动力学也须经过同样的革命。基于波动理论的假设使我们能够解释干涉和衍射条纹。利用这些新见解,也可能调和光的散射色散与光的不连续性之间的冲突,从而解决几乎所有由量子带来的问题。



LOUIS DE BROGLIE
路易•德布罗意

Paris, September 12.
巴黎,九月12日。


 

2010年6月26日星期六

上帝掷骰子,我们织毛衣。

(题图:这是Schroedinger的猫吗?)




在凝聚态物理中人们经常使用“准粒子”、“元激发”这样的概念,以强调它们所描写的对象并非基本粒子。比如,声子只是固体(或液体)中弹性振动的激发,它与光子、电子这样“基本”的粒子不可同日而语。


我在此前已多次提到,这只是一种教条而已。当我们跳出对基本粒子的盲目崇拜之后,你会发现光子和声子之间并没有太大的差别。本来,你安知宇宙本身不是一块巨大的凝聚态材料呢?


我希望以上的陈述不会造成误解:光子和声子当然是不同层次上的现象。我只是想说,作为“基本”粒子的光子并非不能和声子一样具有其更微观层次的起源。


大凡,在物理学家使用诸如“基本”、“内禀”这样的词语描摹对象的性质时,其潜台词是,这种性质不需要进一步解释。这当然不错:在任何理论、任何模型中,你都能追溯到它的基本假定。然而你若将“基本”理解成自然界的终极真理——就如同那些习见的科普宣传那样,那就很索然无味了。一句话:不要一根筋,不用太当真。


我之所以写下这些,是因为回忆起自己在读量子力学时,曾不止一次地见到这样的说法:量子涨落和热涨落有相似性,但不相同。量子力学的随机性是内禀的,是因为上帝在掷骰子;而热力学的随机性是由系统巨量的自由度所造成的,这里没有上帝的事,是你自己在织毛衣罢了。


你也许已经猜到我要说什么了。作为一介准民科,我以为量子力学的随机性并不如此神秘,并不如此内禀。上帝没有玩骰子,他只是默默地看着我们日复一日地织着毛衣,笑而不语。(人类一思考,上帝就发笑?)


如果说我此前的陈述是为了破除对“基本粒子”和对“终极理论”的盲目崇拜,那么接下来,我想破除对上帝之骰子的盲目崇拜,尽管理由并不充分。


首先让我们一起回忆一下:热力学的随机性从何而来。


粗略地说,随机性相当于信息丢失:即使你盘问了系统在此时此刻所知道的一切,你也无法得知此系统从何处来、向何处去。这样的演化在物理上叫做“非酉的”(non-unitary)。


作为对比,经典力学系统的演化是酉演化。对此,拉普拉斯(Laplace)的豪言壮语是很好的概括:知道了宇宙的此时就已知道了宇宙的一切。


说得更技术化一些,经典力学系统的酉演化叫做“刘维尔(Liouville)定理”:在系统演化的过程中,其相体积(系统在相空间中所占之体积)保持不变。


如果说经典力学系统的演化是循规蹈矩,那么热力学系统的演化就是汪洋恣肆。物理上,有热力学第二定律:孤立系统的熵只增不减。技术地讲,熵即是系统相空间的体积(准确地说是相空间体积的对数)。熵增意味着系统相体积的增大。


可是,局限在经典理论的框架下,任何热力学系统,本质上仍然是一个经典力学系统,只是自由度多了一点罢了。刘维尔定理此时应当仍然成立:相体积保持不变。


这是一个佯谬。经典热力学系统的相体积到底是增大还是没增大?


Susskind对此问题有一个优美的解释:经典热力学系统,作为一个经典系统,仍然满足刘维尔定理,即其相体积在演化中保持不变。然而,一个包含巨量自由度的经典系统,尽管它的相体积保持不变,但是随着时间的推移,它在相空间中的形状可以发生非常奇妙的变化,比如演化出一些分形结构,从而变得异常复杂。


可是当我们谈论熵的概念时,是有分辨率的。换言之,我们在度量相空间的体积时总有一个极小值。这个过程叫做粗粒化(coarse grain),更形象地说,当你测量系统的熵时,相空间就被加了马赛克滤镜。显然,系统的很多细节会被这些马赛克弄丢,使得它的相体积看上去似乎是增大了。这就是热力学第二定律。


从以上讨论,你不难发现,熵其实是具有一定人为性的概念。



现在进入量子力学。我们几乎可以将以上讨论平行地搬到这里,只需将相空间改成Hilbert空间即可。对于一个孤立的量子系统而言,Schroedinger方程告诉我们,系统的演化是完整的酉演化,并无随机性可言。事实上,量子力学的随机性完全出现在测量的过程中。


在传统的哥本哈根解释中,这被描写成波函数的塌缩。也就是说,系统的演化在测量的一瞬间变得极其特殊、不可预测。


为什么测量在量子力学中如此特殊?我们不妨问,究竟什么是测量?


一般地,测量可以被理解为一个经典系统(作为观测者)与量子系统(作为被测者)的相互作用。可是,不要忘了我们的信念:任何宏观经典系统都只是一个量子系统的经典近似而已,它在微观上仍然是量子的。


因此,如果我们将测量者与被测量者一并考虑进来,并将它们视作一个大的量子系统,则这个系统波函数的演化仍然符合Schroedinger方程,从而是酉演化。


所以,量子力学的随机性其实就来源于作为观测者的经典系统之完整信息的缺失。


你会发现这里的情形与热力学是多么相似:一切随机性都起源于我们的无知。所以说,量子力学的不确定性并没有它看上去那么神秘。神秘往往来自无知,就像魔鬼往往躲在暗处。


 


一句话,这是一个没有上帝掷骰子的世界,只有一群自娱自乐的人们日复一日地织着毛衣。

2010年5月20日星期四

庄周梦蝶的蝴蝶效应


(题图:范曾,《庄周梦蝶》)


对研究物理的人而言,ArXiv几乎是必读的文库。除了一些值得严肃对待的工作外,ArXiv上也有不少小文,相当于饭后甜点,可以帮助消化。


这篇日志是ArXiv上近两天的三篇小文章的简介和点评。我要声明,这些文章我都没有读完,因此这篇日志只是信笔写来。错漏难免,欢迎讨论。


在正文开始之前还有一则:


通知


本周日是清华物理系的学生节。因此我们本周的讨论班提前到周六进行。即,周六晚18:30开始。届时由北京大学的肖潇同学为大家介绍自旋联络的相关问题。摘要如下:


1自旋联络的一些motivation

2数学形式

3弯曲时空中的旋量场和局域洛伦兹变换

4标架法计算曲率张量

通知结束,正文开始:


 


1、混乱的宇宙?(arXiv:1005.2294)


Frampton又贴出一篇吸引眼球的新文。没错,就是上次那位声称宇宙是一个黑洞的Frampton。这回,他宣布自己根据WMAP7(WMAP卫星的七年数据)的结果所计算出可见宇宙的熵远远超出了全息原理的限制,大约超出了8倍。大有语不惊人死不休之意。


黑洞热力学为一定体积区域中的熵提供了一个上限,这一点在我以前的日志中曾多次提到。简言之,为了使一团空间区域中的熵增加,我们可以向其中投入携带熵的物质。投得越多,熵就越大。但是我们不能投得太多,因为过多的物质将会在此区域中形成一个黑洞。当这个黑洞大到将预先给定的空间区域淹没掉时,我们对这团空间就已一无所知,更不用说它的熵了。


所以,一团球形区域所能容纳的最大熵,就是以其边界为视界的黑洞的熵。这个限制叫做“熵界”(entropy bound)。


黑洞熵有多大呢?物理学家早已经计算出来了,它正比于黑洞的表面积。换言之,可见宇宙之熵的上限正比于其半径的平方。


Frampton既然宣称可见宇宙之熵的实验值大于黑洞热力学给出的上限,那么他必须做两件事情。其一,他要算出这个上限的大小;其二,他要从WMAP7的数据中读出可见宇宙的熵,并说明此熵已经超过了前面算出的上限。(请注意WMAP卫星无法直接测量宇宙的熵。)这几乎是显然的。


第一件事情没有困难。因为黑洞热力学所给出的熵之上限正比于此黑洞的表面积,从而正比于可见宇宙的半径。其比例系数,无非光速、普朗克常量、万有引力常量与波尔兹曼常数的组合。而可见宇宙的半径,WMAP给出的测量结果已经相当精确了,是14.0±0.1Gpc。


关键是第二点:Frampton如何计算可见宇宙之熵的实验值。至少我找不出有什么好办法可以从基本的宇宙学参量中读出可见宇宙的熵。Frampton找到了吗?我翻遍他的文章也没有发现他真的求出了可见宇宙的熵。


那么Frampton做了什么?实际上,他算出了以可见宇宙之半径所确定的熵界,同时算出了质量与可见宇宙相同的黑洞的熵。然后,他求出了两者的比值,大约是8.85。以此宣布咱们宇宙的熵超出理论的限制。


呜呼,到这里你也许看到了,Frampton又使了一个障眼法。他根本没有去算可见宇宙的熵,而是拿可见宇宙的熵界去和一个质量与可见宇宙相当的黑洞的熵作了比较。这和他的那篇宇宙是一个黑洞的文章有任何区别吗?我没有看出来。


看来这篇文章的亮点也就是它的摘要比较吸引眼球罢了。


 


2、纠结的时空?(arXiv:1005.3035


你是否时常听到周围的人们抱怨道他们陷入了某种纠结?你是否自己也时常感到纠结?若果真如此,这篇文章也许会令你安心一些,因为它声称,你无法脱离的时空本身就很纠结。


这篇文章的出发点是AdS/CFT,中文名曰“反德西特空间-共形场论对偶”,听上去很高深。这个结论被认为是20世纪90年代理论物理学最大的进展。它从数学上展现了,一种特定空间中的规范理论与其边界上的引力理论是等价的。当然,它的数学比较复杂,但是结论很简单。你只需记得:引力理论和量子场论有个对应,这就够了。


一个量子场论,对应于一个Hilbert空间。这篇文章考虑的是,如果有两个Hilbert空间呢?当然,它们各自对应于一个引力理论。另外,你也许听说过,广义相对论是引力与时空的对应。因此,每一个Hilbert空间对应于一个时空,两个独立的Hilbert空间对应于两个独立的时空。


然而,既然是量子理论,就不免有纠缠。对,就是总爱拿猫说事的薛定谔同学喜欢的纠缠。这篇文章说,纠缠的Hilbert态就对应于连通的空间。看上去蛮有趣。总之,它的核心思想是,经典空间的展现(emergence)可以有量子的起源。比如,量子态的纠缠与解缠就对应于时空的连通与撕裂。


此文给出了一些有趣的讨论,包括一些思想实验。我还没有来得及仔细读,但这毕竟是很好玩的东西,因此也在这里提一下。


 


3、量子引力的蝴蝶效应?(arXiv:1005.3024


量子引力和蝴蝶效应——两个fancy的名词结合到一起能导致什么?这篇文章说,为了寻找量子引力,我们不用去考察那些极端的例子,诸如黑洞中心或者宇宙大爆炸附近。太阳系内就够了。


万有引力极端微弱却有无处不在,这种轻飘飘的幽灵搞得物理学家们坐立不安。人们通常认为,引力的量子效应必定极端微弱,以至于必须在极其苛刻的条件下它们才会显露出来。这些条件包括刚才提到的黑洞中心和宇宙大爆炸。如果你希望在我们周围从实验上寻找量子引力,那么,请做梦吧。


不过做梦也并非总是一无所获(汤川同学肯定同意这句话)。联想到庄周梦蝶,再联想到蝴蝶效应……这就有了。


蝴蝶效应,是说一只蝴蝶扇动翅膀可能导致一场飓风。科学家希望通过这个表述说明,一个非线性系统对初值极端敏感。系统的非线性会将初始时刻微小的不确定性以指数方式放大。所以,长期的天气预报原则上不可能,因为大气运动显然是高度非线性的。


这篇文章的标题是“太阳系内的巨型量子效应”(Huge quantum gravity effects in the solar system)。它说,太阳系也是一个非线性系统,在长时间内也会呈现出混沌。因此它或许可以将量子引力的效应放大很多。


文中举例说,经典计算认为,天王星在某个时刻会被甩出太阳系。而引力的量子涨落将会影响甩出的时间。


我没有仔细读这篇文章,不过文中给出了太阳系的所谓“李雅普诺夫时间”,它衡量了太阳系将微小初值进行放大的速度。这个时间是几百万年的量级。知道了这个量级,我们就不难估算太阳系将引力的量子涨落放大所需的时间。通常,引力的量子涨落发生在Planck尺度——10的负35次方米。设想将这个涨落放大到一米,则这需要35个量级,相当于自然对数底e的80十次方。从而我们需要80乘以几百万年、亦即上亿年的时间来等待这个涨落放大到“米”的量级。


上亿年的时间。作为天天生活在纠结中的可怜虫,我们还是不要指望能亲眼目睹这些“巨型效应”了。看来,要想摆脱纠结,既不能指望混乱的宇宙,也不能指望纠缠的时空。顶好的方法,就是再去睡一觉。或许,下一个梦中的蝴蝶,真能扇出一场飓风。

2010年4月23日星期五

宇宙是一个黑洞吗?

前不久(4月11日),物理学家Frampton在ArXiv上贴出一篇短文[1],声称自己的新观点可以解决困扰物理学家很久的暗能量问题。他说,如果可观测的宇宙本身就是一个黑洞的内部,那么我们根本不需要假设暗能量的存在。按照目前的理解,暗能量占宇宙总能量的百分之七十左右——这是实验(WMAP)给出的结果。然而对于它的起因我们几乎一无所知。


这里暂且不谈暗能量,且看Frampton的核心假设:将宇宙看作一个黑洞。这究竟是指什么呢?


为了搞清楚这个问题,我们先得知道,什么是黑洞。


相对于现代物理学的其它概念,黑洞就显得很古老了。很多人都知道,数学家Laplace在1796年曾经设想出了这样一种天体。事实上,在更早一些的1783年,地质学家John Michell在给Cavendish的信中就已写下这样一段话:
“如果一个与太阳密度相同的球的半径比太阳小500倍以上,那么从无穷远处落向此球的物体,在落到该球表面时的速度将超过光速。从而,如果我们设想光和其它物体一样,也被正比于其惯性的力所吸引,那么从该球面发出的光将会由于自身的引力而折回。”[2]


这个直观的图像在广义相对论中得到了精确的数学表达。根据相对论,黑洞可以产生于一颗烧尽的恒星。


运气好的话,我们在夜晚可以看见许多恒星。它们不过是自身的万有引力与核燃烧产生的向外的压力相互平衡的结果。当一颗恒星的核燃料用完后,没有足够的力气来支撑巨大的引力,它就将向自己的中心坍缩。坍缩的结果有可能是白矮星或者中子星。这两种天体分别依靠电子与中子的排斥力与引力相抗衡。


然而,如果此时这颗天体的质量仍然很大,比如,大于太阳质量的5倍,则中子间的排斥力也无法抵抗巨大的万有引力。其结果就是,这巨大的引力将使这团物质继续坍缩,直到形成一个黑洞。


不难看出,这是一串将物质不断压缩的过程。当一团物质被压缩到足够小、足够密集时,它就将变成黑洞。足够小是多小?相对论给出的结果是Schwarzschild半径:R=2GM。其中,M是这团物质的质量,而G是万有引力常数。我们的判据是,如果一团物质分布的范围小于它的Schwarzschild半径R,它就是一个黑洞。


如果这还不够直观,我们不妨来做一点简单的估算。对于太阳来说,它的质量M是2乘十的三十次方千克,代入R=2GM,我们得到它的Schwarzschild半径是3km。这就是说,如果把太阳压缩到半径只有3千米,它就将成为一个黑洞。作为对比,太阳目前的半径是70万公里。


这个结果给我们的深刻印象是,黑洞是如此致密。


但这并非全部!关键在于,黑洞的Schwarzschild半径(而不是体积)正比于质量。通过简单的乘除法就可发现,黑洞的密度(M/R^3)其实反比于其半径的平方!


也就是说,黑洞越重,它将变得越稀疏。


所以,尽管整个可观测的宇宙本身很稀疏,但它是否可以是一个黑洞呢?


根据Frampton的估算,可观测宇宙的总质量是10^23倍的太阳质量(换言之,可观测宇宙中有大约1摩尔量级的太阳。),所以它的Schwarzschild半径是300亿光年;而可观测宇宙的半径是480亿光年,与其Schwarzschild半径同量级。因此,我们的宇宙差不多就是一个黑洞。


其实,将宇宙看作黑洞的内部,已经不很新鲜了。早在1939年,Oppenheimer(人称原子弹之父)就已经使用Friedman度规做黑洞的计算[3],这其实就暗示了将宇宙看作黑洞内部的可能性。而在1972年,Pathria(就是写了著名的统计力学教材的那位)在Nature上的一篇文章[4]更是仔细计算了将宇宙视为黑洞的种种后果。此后也有不少文章继续讨论这个问题。


Frampton的文章唯一的新颖之处在于,他声称通过将宇宙等同于一个黑洞,就可以计算黑洞辐射的温度。再使用温度和加速度的关系(Unruh效应),就得到了宇宙的加速膨胀。于是,我们不再需要为了解释实验上看到的加速膨胀去人为假设一种神秘的暗能量。


但是这种类比仍然是很可疑的。这是因为,我们通常对黑洞的认识,都是在离它很远处的渐进平坦的空间中得到的。比如远离黑洞的观察者可以看到Hawking辐射,但是在自由降落系中就看不到任何辐射。可是,当我们研究宇宙的时候,通常只能采用自由降落系(通常叫做共动参考系)。因为,我们没有办法跳到宇宙之外的远处去观察它。此时,Hawking辐射从何而来?黑洞的温度又从何而来?这都是不清楚的。


另外,注意到,宇宙的加速膨胀是尺度因子的膨胀,而非某观测者的加速运动。显然,使用Unruh效应(相对于惯性系的加速观测者将看到热的真空)的类比也需要进一步解释。


Frampton作此断言的主要原因在于,他用这种方法所得结果的量级与观测粗略吻合。比如,他算出宇宙的Schwarzschild半径与其真实半径几乎相同(相差1.6倍)。


可是我们不要忘记,宇宙的密度随着它的膨胀而下降。在最近一百亿年的物质主导时期,宇宙的密度反比于其尺度因子的三次方。这意味着,当我们向着宇宙早期追溯时,它将变得越来越密,以至于它的半径将显著小于Schwarzschild半径。这该作何解释?


如果Frampton的文章是正确的话,那么他所使用的各种类比之间就必然存在有尚未被解释清楚的物理联系。我相信,如果我们找不到这些更深层的东西,则他的计算只能是某种巧合罢了。


**************************************


猜猜看:这些照片中的同学您认识几位?(答案在最后)





参考文献:


[1] P. H. Frampton, arXiv:1004.1285v2
[2] Wikipedia: http://en.wikipedia.org/wiki/Black_hole
[3] J. R. Oppenheimer and H. Snyder, Phys. Rev. 56, 455 (1939)
[4] R. K. Pathria, Nature 240, 5379 (1972)


相关人物:


1、Frampton:宇宙是一个黑洞!


2、原子弹之父Oppenheimer


3、大名鼎鼎的《统计力学》作者Pathria


4、Unruh大叔:加速系中的真空是热的!


5、大家对Hawking的典型形象太熟悉了,这里用一张1946年的旧照吧。

2010年3月19日星期五

从全息原理到牛顿定律

继续上篇的讨论。


Verlinde的主旨,是希望将全息原理作为更基本的假设,并由它推导出我们已知的引力理论,如牛顿力学或广义相对论。为了解释这个想法,Verlinde反复引用了弹性理论的例子:一百多年前的人们并不知道什么是原子、什么是晶格,但这并不妨碍他们建立关于固体弹性的宏观理论。只是当人们认识到了原子之后,才可以重新用原子理论的一套方法重新推导出已有的弹性理论。Verlinde认为,牛顿力学或者广义相对论恰好相当于宏观的弹性理论,而全息原理就扮演原子理论的角色。


这自然是恰当的类比。然而引力与弹性理论的不同在于,我们今天还处在“前Planck物理”时代,因此并无完整的全息原理可供使用。所以要找到一个合适的全息假设,我们只能从现有的理论入手,管窥蠡测地去寻找全息原理的蛛丝马迹。这虽然困难,却并非不可能。因为,虽然微观理论深藏于极其微小的Planck尺度,但是那里发生的一些秘密会泄漏到我们可见的世界中,这就是黑洞熵。


在经典情形,黑洞只有极少的自由度,即质量、角动量和内部对称性的荷(例如电荷)。这就是所谓的无毛定理(No-hair theorem)。然而当考虑量子效应后,黑洞就有非零的熵,且正比于其表面积。这一点最初似乎由Bekenstein提出。事实上,如果黑洞熵正比于其表面积,则当我们向黑洞中投入一颗质点后,黑洞的熵和表面积都会增加。可是人们当时已经知道,当质点以恰当的方式被投入Kerr黑洞时,黑洞的质量与表面积并不增加。


Bekenstein注意到[1],这个结论基于“质点”的假设。当我们考虑了量子力学后,任何粒子,即使是基本粒子,都有一个尺度,它或者是粒子的Compton波长,或者是Schwarzschild半径。当这样一个半径不为零的“球状物”被投入黑洞时,黑洞的半径确有不为零的增长。Bekenstein将之视为黑洞熵的增长。


黑洞有熵,意味着它包含着巨大的微观自由度。不仅如此,黑洞还有温度,还有热辐射。这就是著名的Hawking辐射。当然,这也是与经典理论直接相悖的结论:根据经典广义相对论,黑洞不仅无毛,而且一毛不拔。


为了理解这个结果,Unruh给出了一个有趣的解释[2],现在人们称之为Unruh效应。它说,在惯性系中的观察者看来空无一物的真空,在加速的非惯性系观察者看来,却是一个有温度的“热浴”,这个加速观者将看到无数的作热运动的粒子。简单地讲:你只要在真空中兜圈子,周围就会变热。你跑得越快,温度就越高。


这个有悖直觉的结论其实并不太出乎意料。关键在于,加速观者与惯性观者所用的钟表不同:它们之间并不是简单的Lorentz变换,而是一个非平凡的广义坐标变换。另一方面,我们知道,量子场论中的真空实际上是指万物的基态:并非一无所有,而只是悄无声息而已。一旦当你进入到一个加速的参考系中,由于你所携带钟表变了节拍,原来悄无声息的基态就变得喧闹起来。这就是热背景的由来。


Unruh效应虽然是对平直空间而言,但与Hawking辐射其实是一件事情。你只需注意到,自由降落的参考系与惯性系无异:无论在下坠的电梯还是漂浮在太空中的飞行器,你在其中感受到的物理是一样的,尽管心情可能完全不同。所以,一个自由降落进黑洞的观测者就相当于惯性观察者,他不知道什么是黑洞,当他穿过黑洞边界时不会出现任何异常。自然,他也看不见黑洞辐射。然而在它看来,远处的观察者相对于它在作加速运动。而根据Unruh效用,相对于惯性系作加速运动的观察者必看到热辐射:这就是Hawking辐射。


好了,以上就是全部的准备工作。接下来我们展示Verlinde的推导。[3]


Verlinde说引力是熵力,即熵增原理的宏观效果。比如渗透现象就是一种熵力。在给定的温度T下,根据能量守能,熵力F可由熵变ΔS确定为:
 
因此只要知道了温度T和熵变ΔS对位移Δx的依赖,即可求出熵力。



不要忘记全息原理:它说,信息储存在界面上。首先考虑局域的情形,我们取一小块屏:



大致上我们可以将此屏视为空间的边界。这块屏的左边是什么我们不清楚,而它的右边则是我们已知的空间。现在,在其右端距离一个Compton波长左右的位置Δx放置一颗质量为m的粒子,全息原理假定,由此粒子贡献于屏上的熵ΔS为:



这就是熵变对位移的关系。至于温度,我们有Unruh效应:对于一个加速度为a的观察者,“真空”的温度由下式给出:



由以上三式,消去熵变ΔS和温度T,瞧瞧我们得到了什么:



以上是一个局域的推导。接下来我们取一块完整的屏,一张包围了质量M的球面。



根据全息原理,假定该球面所包围的微观自由度N正比于其表面积A。由量纲的考虑补充进适当的常数,就是:


 


再假设此球体内的能量均分于各微观自由度,即Boltzmann能量均分:



而该能量E由球面所包含的质量给出:



另外,球的表面积A为:



则由以上四式,再加上熵力的定义(1)与全息假设(2),不难得到:



OK,我们暂停此处,不多解释。


 


给出参考文献,供希望知道细节的同学查阅:


[1] J. D. Bekenstein, Phys. Rev. D 7, 2333 (1973)


[2] W. G. Unruh, Phys. Rev. D 14, 870 (1976)


[3] E. Verlinde, arXiv: 1001.0785 (2010)

2010年3月14日星期日

全息引力

自然界有四种基本相互作用。这是现代物理中惯常的说法。在这四种相互作用中,引力(gravity)无疑是最早为人所知的一种。牛顿的万有引力定律在今天已成为人所共知的规律。然而在目前看来,引力也是四种基本相互作用中最令人费解的一种。


其实说费解倒也未必,因为我们对引力并非一无所知。实际上,我们有广义相对论。这个描写引力的理论从理论结构到实验验证无疑都很成功,近乎完美。


既然如此,我们仍然认为引力难于理解,就必然另有原因。我以为这个原因来自引力独特的个性。与其它三种相互作用相比,引力显得非常与众不同。如果你下意识地认为四种相互作用应当在某种程度上被统一(亦即可由单一的理论来解释),那么这种与众不同就显然难以理解了。


引力最突出的特征在于,它作用于所有的物质。如果观察其余三种相互作用,我们就会发现,每一种相互作用都只对带有相应“荷”的一类物质起作用。比如,只有带电荷的物质间才会有电磁作用。而引力则不同,它与所有具有能量的物质发生作用。所以或许可以等效地说,能量就是引力的荷。


既然如此,也许引力与其余三种相互作用确有不同的起源。广义相对论将它的起源归结于时空的几何。这个观察来自等效原理,简言之即惯性质量和引力质量相等。如果确实如此,那么只需要牛顿定律,你就会发现,在引力作用下的质点的运动方程与它的质量无关,或者说与物理的动力学无关,从而变成了一个纯几何的方程。等效原理在这里所起的作用十分关键,所以它的正确性自然就很重要。这就是为什么自伽利略扔铁球以后的几百年里,人们还在不断地重复类似的实验而只是为了提高精度。的确,等效原理在目前已被验证到了极高的精度,大致在十个量级以上。


不过可惜的是,这些验证都是宏观的实验。因为引力实在太微弱,所以在微观领域极难被观察到。事实上,目前还没有实验能在毫米尺度以下观察引力的效应。相对于高能物理中的其他相互作用而言,这个尺度显然是非常大的。说得严重一些,我们根本没有在毫米以下的尺度观察到引力,所以没有任何直接证据表明等效原理以及广义相对论在这个尺度下仍然成立。


这为理论家让出了空间。既然引力的微观规律完全未知,那么不妨假设它是衍生的(emerge)。也就是,在微观领域并不存在什么万有引力——它只是另一种微观物理在宏观条件下所显示的现象。正如压强:你无法谈论一颗气体分子的压强是多少,因为压强是大量气体颗粒的集体行为。


物理学家在“衍生”的引力方面做出了各种尝试。花样翻新,一年一度。如果说去年的热点是Horova在一月份提出的“相变”引力(见此前的一篇日志【切除时间】),则今年的热点就是Verlinde同样在一月份提出的“熵力”。


简单地声称引力是衍生现象自然是没有根据的——我们得有一个可作为指导性的原则,或假设,方可作此断言。这就如同声称引力是几何效应需要以等效原理为前提。


Einstein的相对论基于等效原理,而Verlinde提出的“熵力”则基于全息原理。



与等效原理不同的是,全息原理到目前为止不仅没有实验验证,甚至在理论上也是不完全的。人们并不清楚如何一般而精确地表述它。大体上,这个原理是说,一团空间内的物理可以由其边界上的过程所描述。


关于全息原理,物理学家的灵感来源于黑洞。根据Bekenstein的著名结果,黑洞有熵,且其大小正比于黑洞视界的面积。如所周知,熵这个物理量记录了物质所含状态数(或者信息量)的多少。黑洞具有非零的熵,意味着它具有大量的微观状态数。此熵又正比于视界的面积,这个事实暗示我们,黑洞的微观状态都被记录在了它的边界上。


由此我们可以推断出另一个有趣的事实,即一团空间内所能包含的最大熵,或者说,这团空间所能记录的信息量,存在上限。对于一团球形的空间,这个上限恰好是以其边界为视界的黑洞的熵。(这个推导很简单,请见此前的一篇日志【不确定性原理的毁灭?】。)瞧,空间所含的信息量由其边界所控制,可见全息的概念不止出现在黑洞中。


一定体积的空间所包含的信息量有限,这与量子场论直接矛盾。因为通常的场论是一个定域的理论,它假设时空是连续的,从而可以谈论“点”的概念。在场论中,原则上可以将物理对象局限于任意小的区域内,从而一团空间所能承载的信息量原则上可以任意大。


这里之所以出现了矛盾,乃是由于连续时空的假设是一种近似。场论通常所涉及的尺度比时空涨落的尺度大了许多,因此对这种涨落并不敏感。这很好理解:比如,我们通常可以认为固体中的声波是连续的弹性波,这是因为此时的声波波长远大于晶格的大小。但是如果振动模式的波长与晶格的尺度相当,则连续波的近似就不再成立。在固体物理中,计算固体比热的Debye方法就用到了连续波近似,结果遇到发散。发散的原因是此近似在高频区(短波长)不再成立,所以需要截去高频区的贡献,以得到一个有限的结果。与之完全相同,量子场论中屡屡出现的发散,也可以被解释成高能区(小尺度)下场论的连续时空假设完全失效的结果。


全息原理与量子场论的矛盾,显示出引力更为独特的个性。它暗示我们,可能某些大尺度下的引力效应,也根本无法用场论描述。此时需要另一套与场论完全不同的方案,比如弦论。或者是Verlinde提出的熵力。Verlinde指出,若从全息原理出发,将引力视作一种熵增效应,则在某些一般的假设下,可以推导出牛顿第二定律以及万有引力定律。而实际的推导只需要初中数学就够了。关于其中细节,容我下回再叙。

2010年3月9日星期二

肮脏的物理

请问,1+1+1+1+……,这个求和的结果是多少?


几乎不用思考,你立即就能指出,它的结果是无穷大。


然而,据说,物理学家们认为1+1+1+1+……=-1/2。


令我印象深刻的是,Wiki在对这个序列的介绍中引用了一篇文章(arXiv:gr-qc/0409076v1)中的话。我姑且将它抄在这里:



  • “在不到一年的时间内,两位杰出的物理学家Slavnov和Yndurain先后来到巴塞罗那讲讨论课,当然是关于两个不同的领域。值得注意的是,在演讲中的某处,两人都向听众说出了这样的话:‘如所周知,1+1+1+…=-1/2’(As everybody knows, 1+1+1+…=-1/2)。”


该文进而评论道:



  • “也许这意味着,‘如果你连它都不知道,那就不用听下去了’。顺便提一下毕达哥拉斯学派的引理,‘不懂几何者勿入’。”


我也顺便提一下,“不懂几何者勿入”似乎是柏拉图学园的门牌,跟毕达哥拉斯无关。


这个计算用到了zeta函数正规化方法。(zeta函数正规化其实在场论中经常出现,但常见的场论初级教科书对此很少提及。我参考Ramond的书以phi-four理论为例将其整理成一个简单但粗糙地笔记,供感兴趣的同学【下载】。)


正规化方法是理论物理中常见的计算方法。非常粗糙地讲,它的大意是:对一个发散的表达式进行计算,并算出一个结果。


含有发散的问题常使人感到尴尬,当然这也因人而异。通常令数学家忍无可忍、火冒三丈的东西,物理学家却处之泰然。这正是物理与数学的巨大区别。这使我想到某位前辈(如果没记错应该是Pauli)说过的话:“要学物理,就得把手弄脏(To learn physics you must get your hands dirty.)。”


许多初入门径的物理系学生对此颇不习惯,我感受尤深——这里插两句闲话。清华数理基科班富有实验精神,善于拿各届学生做试验。我这一届所接受的实验方式是,从大一开始学习很专业的数学,数学系的老教授讲课时完全将我们视为未来的纯数学家。事后看来,这样做的好处与缺点都非常明显(这里是相对物理系的同学,对数学系而言显然是优点远大于缺点)。比如,最终大家都学会了“用数学分析课来攻击量子力学的严格性”(量子力学老师庄鹏飞先生语)。


我想说,物理学对这种攻击基本上是免疫的。理由如下:


1、这一条送给物理的初学者。在大多数情况下,物理推导显得不严格,并非由于它们真的不严格,而是因为物理学家知道如何严格地表达它们,但这种严格表达的代价也许是大费一番唇舌,故而代之以大家都能看懂的却不那么严格的方式。这种情形多出现于初级的物理课本中,比如四大力学。


2、另一些情况下,物理定理显得不严格,是因为物理学家根本没打算让它变得严格。比如常见的连续条件、可微条件,物理学家常常一概不管。这种不拘小节显然可以大大提高工作效率,而且通常不会出错(当然也有出错的时候,那要另当别论)。事实上,物理方法的亮点就在于“关心主要矛盾”。从而,它很忌讳“事无巨细”。


到此为止,我一直试图照顾数学系同学的情绪。接下来,就要原形毕露了:


3、在一些极可能“出错”的地方,物理学家宁可出错,而不是去关心严格性。比如前文提及的正规化方法。事实上,对同一个发散的表达式,使用不同的正规化方法进行计算,时常会得到不同的结果。(比如,对非绝对收敛的级数任意调换求和次序。)此时,物理学家更感兴趣的问题是,这些不同的结果是否都有物理意义,或者,哪些结果最令人感兴趣。因为,结果之所以如此,往往是因为在对物理问题作数学陈述的过程中已经出现了某种错误,因而正规化方法就相当于将错就错,错错相抵。对此A. Zee说过,“天才和凡人都犯错,不同的是天才错偶数次,而凡人错奇数次”。


4、物理学家关心“发现了什么”而不是“是否严格”。物理学从来没有严格过。近代物理学的第一套完整理论——牛顿力学,就建立在远非严格的微积分的基础上。推而广之,近代科学的第一要义,绝不是关于严格,而是关于有效性。(因而在这个意义下,数学并不能算作科学。)科学的威力对人们的震慑并不来自它的严格性,而是来自它的效果。工业革命、电器技术、原子弹、卫星,对大众而言,这其中的任何一点都比纸上谈兵的严格性证明更具说服力。你会发现,科学常常自称有一套“严格的研究方法”,但这只是自我标榜而已。可是人们常常被这种标榜弄得习而不察,竟然往往视“科学的方法”这个短语为褒义,实在滑稽。事实上,要论严格性,科学可能远不及中世纪的神学。


5、对于物理学家而言,本来也无关心严格性的必要。因为物理学的对象是自然。在我看来,对人而言,自然最大的诱惑力在于它的复杂性。因此如果我们仍要一厢情愿地将自然理解为一颗晶莹剔透、完美无瑕的钻石,那简直就是对自然的侮辱。说到底还是那句话:自然不是无菌室,要想研究它,就得将手弄脏。


(附件:关于Zeta function regularization的note)

2009年12月26日星期六

各种无穷大


今天,物理学家(至少理论家)对无穷大的出现早已处之泰然。物理理论中到处都可以有无穷大。比如,如果你坚持牛顿引力的平方反比律,那么当你越来越接近一个质点时,你感受到的引力就会趋于无穷大。


一般来说,出现无穷大就意味着理论在某种意义上的失效。这种失效可以来自于一些不合适的假定。在上例中,引力趋于无穷大是因为我们假设了“质点”的概念。我们之所以谈论质点,就是假定了它的尺寸对我们感兴趣的问题来说可以忽略不计。比如,当我们讨论月球绕地球的运行时,将月球视为质点,就是有效的假设。但对于登月的宇航员,再将月球看作质点,就是无稽之谈。换言之,月球的尺寸在我们越来越靠近它的时候变得越来越不可忽略,因此早在引力变成无穷大之前,月球作为质点的假设就崩溃了。真实的自然因之而幸免于无穷大。


无穷大似乎总是人造的。仍用上例。引力变成无穷大,是因为我们在理论中放进了一个密度无穷大的物体(即质点)。当然,我们可以抛开这个也许已经使你感到无聊的例子,去关注一些更有趣事情。比如,相变过程中某些热力学参量趋于无穷,是因为我们事先假定了系统本身为无穷大(即所谓的热力学极限)。比如,恒星坍缩成黑洞,在其中心形成了一个密度无穷大的“奇点”,是因为我们假定了时空本身的连续性,请注意,连续性本身就是一种无穷大!还有,微扰量子场论中“费曼图”出现了无穷大,是因为我们假定了“场”本身具有无穷大的自由度。


“无穷大”的确使人难以理解,也许它纯粹是寄居于人类理性中的魔鬼,而并非自然界中的真实存在。比如我们可以问,自然界真的存在实数吗?我倾向于否定的回答。至少就我们目前所知,时间和空间本身不具有如同实数集那样的完备性。


不过,无穷大的假设为理论研究带来的巨大的实惠。如果没有质点的概念,牛顿力学的复杂程度将是不可想象的。几百年来,人们发明了许多工具来驯服无穷大的魔鬼,在今天看来成果丰硕。物理学家可以悠然自得地玩弄delta函数,以享受它为计算带来的方便,而不去理会数学家的那一套广义函数的复杂论证。就如同当年的牛顿玩弄他的微积分,而不用关心他其后数百年分析学家的种种努力。当然,这一切都与无穷大有关。


然而形势并非一片大好。自然总在为我们制造种种困惑,或者毋宁说是我们总在自找麻烦,而这些困惑和麻烦往往与无穷大有关。以下几个有趣的例子,展示了(近似的)无穷大对物理所造成的某些极富戏剧性的影响。我且民科一把,以逃避所有的细节。


 


衍生的时间箭头?


第一个例子是热力学。


热力学处理的对象通常是由巨量粒子构成的系统。对其中的每一个粒子逐一描述显然是一种不合理的做法。我们可以有两种对策:一是直接总结现象规律,而是寻找某种假设以解释这些规律。前者即为热力学,后者就是统计物理。
热力学中最引人注目的地方必然是热力学第二定律。这个定律关乎过程的可逆性。也就是说,它引入了一个时间的箭头。


掌握粒子自身运动的物理(量子力学)本身是时间反演不变的,因此热力学时间箭头是一个衍生(emerge)的效果。衍生,就是说在微观层次上不曾有的某种规律,到了大尺度的条件下“自发”地出现。“衍生”本身也许并不使我们感到意外,我们真正意外的是衍生出了一个时间的方向!


我们已经提到,时间的方向与过程的不可逆性紧密相关。为什么过程不可逆?比如那个被举滥的例子:为什么玻璃杯只能掉到地板上摔碎,而碎玻璃不能自发地拼成一个玻璃杯?


我们可以将此解释为某种信息的丢失。极粗略地说,热力学第二定律断言熵不减。熵本身可以被视作信息的丢失,因而热二律就成为:信息只能丢失,不会增加。


然而大自然真正丢弃了信息吗?至少我目前不这样认为:当你烧掉一本书时,书中的信息似乎丢失了,但它们其实仍然被记录在作为燃烧产物的气体分子的位置和动量等信息中。此时,如果你能精确地摆置此系统中的每一颗气体分子,使得它们的状态精确地成为前者的时间反演,我相信它们还会聚集在一起拼成一本完好的书。


类似的讨论可以用来解释为什么我们有可能看见黑洞,而不太可能找到白洞。因为:黑洞作为恒星演化的结果,可以自然地出现;但是,白洞,作为黑洞解的严格的时间反演,需要极其苛刻的初始条件,以至于它的形成本身就像气体自动拼成书一样不可能。


 


对称性自发破缺?


对称性自发破缺是今天理论物理的流行概念。其实它本身不难理解:想象这样一根筷子,它本身具有完好的轴对称。当你同样以完好地轴对称的方式将它竖立在桌面上,然后松手。接下来发生了什么?筷子倒了,倒向某个特定的方向。从而,轴对称遭到破坏。


这个过于简化的例子已经勾勒出了对称性自发破缺的基本特征:掌管系统的规律本身具有良好的对称性(牛顿定律本身并没有对筷子的倒向持有某种偏好),但是存在许多不同的能量最小、最稳定的“基态”。由于筷子在跌落的时候总得选择一个方向,所以当它选定一个基态时,原有的对称性就丧失了。这就是对称性自发破缺的基本含义。


到这里似乎问题不大。但是如果我们将它运用到量子力学中呢?请注意,在量子力学中,态是可以叠加的。所以你会问:如果我们让系统选在所有基态的叠加态上,会发生什么呢?我们完全可以选择一个保留对称性的叠加方式,使得系统的基态根本就不破缺这种对称性!


让我稍稍进入细节:请考虑一个一维势阱V(x)=-a x^2+bx^4,它有两个坑:x=±x_0,对应于两个基态A和B。的确,当系统落在这两个态中的任意一个时,关于x轴的反射对称性消失了,对称性自发破缺;然而如果将基态取为A+B呢?我们立刻发现:对称性没有破缺!


无穷大在这里起作用了。关键在于,对于有限大的系统,量子涨落倾向于将对称性恢复回来,一个对称性被破缺的基态随时间演化,会回到一个恢复了对称性的基态并停留于此,所以对称性没有自发破缺;但对于无穷大系统,这种演化需要无穷长的时间,以致真正的基态就是对称性已被破缺的态。


如果我们一开始就系统摆置在保持对称性的基态上呢?对于一个无穷大系统,答案是任何微小的扰动都会将系统推到一个破坏对称性的基态上。请注意,虽然所有的基态能量都相同,但并非所有的基态都稳定!只有那些能将几乎所有扰动算子对角化的状态才是真正稳定的。


在量子世界中,只有无穷大系统才有真正的对称性自发破缺。所以,量子场论中的对称性破缺在此不受威胁:因为场论本身就是无穷多自由度的量子理论。


 


薛定谔的猫?


以上关于对称性自发破缺的讨论让我们回想起薛定谔的猫。这是量子力学中关于测量的问题。在量子力学经典的哥本哈根解释中,量子态在一次“测量”过程中所经历的演化是非酉的(non-unitary),也就是不可逆的。在此过程中,量子态“随机”坍缩到测量算子的某一个本征态上,不商量,不解释。


这自然使物理学家感到难堪,因为我们总想寻求某种解释,“通过和平谈判的方式解决问题”。所以,物理学家为此找到了退相干(decoherence)。其基本想法是,考虑测量的过程是如何发生的。测量,它其实是被测量对象,作为一个量子系统,与测量者发生相互作用的过程。用薛定谔本人热爱的术语来说,就是被测量的量子态与环境的量子态发生了纠缠。请注意:完整的描述应该包括被测系统与环境耦合在一起的大系统,但是这是我们无法做到的,因为环境本身(也许就是整个宇宙)的量子态是无法精确描述的。我们所能观察的仅仅是被测系统本身。所以我们所能做的描述本身就含有信息的丢失。这正是不可逆的来源!


(希望以下讨论不会激怒动物权利者)
如果我们照此讨论薛定谔的猫,我们就会碰到与对称性自发破缺类似的问题。请注意,我们此处关心的问题不在于,当我们看到它之前它到底是死还是活,而是说,为什么它一定是非死即活,为什么它不能塌缩到一个死与活的叠加态上。


你会发现这与对称性破缺的情况非常相似。那里,我们的问题是,为什么系统会停在一个对称性破缺的态,而不是这些态的叠加态。因此,我姑且类比上面的解释,对于“猫”这种宏观的、近似无穷大的系统,真正稳定的、能几乎对角化所有测量算子的状态,只有死和活两种。


---------------------------------


不难发现在我们的讨论中无穷大所起的作用。总结成一句话就是:我们的各种困惑来自于信息的丢失,而这信息的丢失来自于我们在一个巨量的、趋近于无穷大系统面前所表现出的无能为力。




今天的音乐,是Scarlatti的键盘奏鸣曲K213。


Pletnev用钢琴所作的现代化演绎让我们感受到Scarlatti的小品中那些超越时间的意义。点此下载。它来自Virgin的唱片:


2009年12月19日星期六

为什么看不见高自旋粒子

 


Why high-spin particles are not seen yet?


 


(Some
derivations have been removed since it's not easy to input mathematical
equations here. To see the full text please download the PDF file
attached. Here is the LINK.)


 


Introduction


Historically, the concept of spin was introduced by Uhlenbeck and Goudsmit in 1925, in order to explain somewhat weird result of the well-known Stern-Gerlach experiment. They hypothesized that, every electron has an intrinsic angular momentum of \hbar/2. At that time, however, the origin of this intrinsic angular momentum was not clear. Naturally, one might identify the spin of an electron as the rotation along the axis passing through its center. But this does not work, as posed by Lorentz, who showed that the linear velocity of the “surface” of an electron will exceed the speed of light, if such a viewpoint is taken. This is evidently forbidden by the theory of relativity.



The rigorous and systematical treatment of the theory of spin was first given by Wigner, who developed his theory in the frame of the quantum mechanics. As we know, the central idea of the quantum mechanics is the quantum state and the Hilbert space. If a particle can be represented by a state in the Hilbert space, then the symmetry that governs the motion of the particle will also acts on the Hilbert space. We know that symmetry can be described mathematically by a group, thus the action of the symmetry on the Hilbert space can be accordingly described by the representation of the group.


The crucial thing here is that the representation of a symmetry group on a physical Hilbert space must be a unitary (or anti-unitary) representation. This is the famous Wigner theorem. A direct consequence of this theorem on particles, is the fact that a massive particle with spin s has 2s+1 degrees of freedom, while a massless particle always has two degrees of freedom, which has nothing to do with its spin. In principle, the spins of both massive and massless particles can take any positive integer and half-integer value, including zero.


On the other hand, in quantum field theory, particles are created by field operators, which can be classified by their transformation properties under Lorentz transformations. The different classes of fields are known as scalar, vector, or tensor, etc. Of course, they are also the representations of the symmetry group of the space-time, but these representations are quite different from ones carried by states. Since the former is finite-dimensional and non-unitary, while the latter is infinite-dimensional and unitary. This fact leads to a problematic result: the degree of freedom (DOF) of the field will in general be different from the DOF of the state (or particle) created by that field. To fully understand this problem, we will introduce two interesting theorems. They are known as “no-go” theorems which mean the statement of the theorems are negative.


 


Weinberg-Witten Theorem


The Weinberg-Witten theorem mainly deals with the massless particles. The formal statements of the theorem are as follows:


Theorem 1: A theory that allows the construction of a Lorentz-covariant conserved four-vector current J^\mu cannot contain massless particles of spin j>1/2 with nonvanishing values of the conserved charge \int\di^3x J^0.


Theorem 2: A theory that allows the construction of a conserved Lorentz covariant energy-momentum tensor T^{\mu\nu} cannot contain massless particles of spin j>1.


The proof of the theorem is straightforward. The strategy is to consider the S-matrix elements of the conserved current.


(To see the details of the proof, please download the PDF file attached.)


Coleman-Mandula Theorem


The Weinberg-Witten theorem excludes the presence of charged massless particles with too large spin. However it says nothing on massive particles. Now we introduce the more powerful Coleman-Mandula theorem, which is also a no-go type theorem.


Theorem
1) For any M there are only a finite number of particle types with mass less than M.
2) Any two-particle state undergoes some reaction at almost all energies.
3) The amplitude for elastic two-body scattering are analytic functions of the scattering angle at almost all energies and angles.


With these assumptions, the theorem claims that the only possible Lie algebra of symmetry generator consists of the generators of the Poincaré group, together with possible internal symmetry generators, which commute with the Poincaré generators.


 


A possible explanation of the absence of high-spin particles


With the Coleman-Mandula theorem in hand, let us go back to the problem of the spin. As has mentioned in Section 1, the degrees of freedom between the field and the corresponding state have a nontrivial mismatch when the state has the spin s≤1. For instance, A vector field, which has 4 DOFs, can create a state with spin 1, which has only 3 (or 2 in massless case) DOFs. Another example is the gravity: A metric field has 10 DOFs, while a graviton, as a massless particle, has only 2 polarizations.


We see that as the spin goes higher, the mismatch between fields and states becomes more serious. This result suggests that there exist redundant and unphysical DOFs in fields. To exclude these redundant DOFs, we should impose the gauge symmetry on the fields. Conventionally, these kinds of fields are called gauge fields. It explains why gauge symmetry is necessary.


As we have learned in classical electrodynamics, in a physical theory with gauge symmetry, the gauge field must couple to a conserved current to maintain the gauge invariance. Generally, we can write this coupling term in the Lagrangian as:


(Omitted derivations)


Now the Coleman-Mandula theorem works: The theorem claims that all the conserved charges, or generators of inner symmetries commute with Lorentz generators, hence these charges Q must be scalars and carry no Lorentz indices. Then the current corresponding to such a generator must be a vector J^\mu. so as the field coupled to the current. We conclude that inner symmetries can only offer couplings to a vector fields, which corresponds the spin 1 particle.


The remaining choice of the generators are Lorentz generators. For example, the momentum generator P^\mu, as a vector, produces a conserved current of rank-2 tensor T^{\mu\nu}, which is just the well-known energy-momentum tensor. This tensor couples to gravity, thus make an opportunity for us to detect the spin-2 gravitons. The last choice is angular momentum generator J^{\mu\nu}, which permits a coupling to a rank-3 tensor field, which I haven't heard about yet.


Now the list of symmetry generators is exhausted. We see that no elementary particles with spin higher than 3 can be detected, due to the lack of proper type of interactions.


 


最后是音乐。现代音乐大师Messiaen的钢琴曲“二十圣婴默想”的第十一首。点此下载


它来自Aimard在Teldec的唱片: