转载http://www.changhai.org/articles/science/mathematics/riemann_hypothesis/11.php
Montgomery 虽然得到了有关 Riemann ζ 函数非平凡零点对关联函数的猜测性结果。 但这一结果究竟有什么深意? 对他来说却还是一个谜。 他觉得这个结果应该预示着某种东西, 可那究竟是什么东西呢? 他毫无头绪, 这多少让他感到有些苦恼。
带着他的研究成果, 也带着那几分苦恼, Montgomery 于 1972 年春天飞往美国圣路易斯参加一个解析数论会议。 那趟旅行对 Montgomery 有着一举数得的意义。 除会议本身外, 他还到 Michigan 大学 (University of Michigan) 所在地安娜堡 (Ann Arbor) 买了房子, 因为此前不久他已接受了一份 Michigan 大学的工作 (Montgomery 目前仍在 Michigan 大学数学系)。
至此, 那趟旅行可以说已经获得了精神与物质的双重丰收。 但在结束旅行前 Montgomery 还有一件事情放心不下。
我们在 第三节 曾经提到过 Gauss 有一个 “坏毛病”, 那就是常常不发表自己的工作, 结果使得同时代的许多数学家在研究课题上与他 “撞车” (与 Guass 那样的大师玩 “碰碰车”, 谁的脑袋先碰破就不必说了)。 无独有偶, 二十世纪的 Princeton 高等研究院也出了一位有同样 “坏毛病” 的数学家, 那便是挪威数学家 Atle Selberg (1917-2007)。 Selberg 在 Riemann 猜想的研究中也有着极为重要的地位, 我们在 后文 中将会更多地介绍他, 这里就先不赘述了。 让 Montgomery 放心不下的就是自己会不会与 Selberg “撞车”? 自己的这项研究工作会不会不幸地在 Selberg 的某一叠草稿纸上已经有了? 当然, 除此之外他也很想顺便听听这位 Riemann 猜想研究领域中的顶尖高手对自己这项研究的看法, 尤其是想听听他对这项研究背后可能隐藏着的深义的理解。
于是在返回英国前他决定在 Princeton 高等研究院做短暂的停留, 以便会见一下 Selberg。
Montgomery 如愿见到了 Selberg。 但 Selberg 听完了他的工作介绍后只是礼貌地表示了兴趣, 却没有提出具体意见。 不过他总算也没有说: “干得不错, 小伙子, 但是 N 年前我就已经证明过这样的结果了”, 还是让 Montgomery 松了一口气。
Fuld Hall |
见过 Selberg, 心事算基本了却了, Montgomery 便和他的朋友、 印度数学家 Sarvadaman Chowla (1907-1995) 一同到高等研究院的 Fuld Hall 去喝下午茶。 喝下午茶是一种很普通的休闲, 但对 Princeton 高等研究院 (以及其它很多美国高校及研究所) 来说, 却是学术氛围的一个重要组成部份。 在这一时间里, 来自世界各地、 从事不同研究的学者们在茶室里互相攀谈, 交流看法, 往往会撞击出一些意想不到的智慧火花。 Montgomery 的这次下午茶就是一个很好的例子。
Montgomery 和 Chowla 正在喝茶闲聊的时候, 一位物理学家走了进来。
在 Princeton 高等研究院这样一个科学家阵容豪华得近乎奢侈的地方, 在随便哪个角落碰上的都可能是非同小可的人物。 这位漫步走进茶室的物理学家也不例外。 此人在二十世纪中叶曾因证明了量子电动力学 (Quantum Electrodynamics) 的几种形式体系彼此等价, 而获得了很高的声誉, 也为他赢得了 Princeton 高等研究院的终生职位。 而这项研究还只不过是他科学生涯中许许多多研究中的一项。 他的研究涉及到核物理、 凝聚态物理、 天体物理, 乃至天体生物学等诸多领域。 这位物理学家便是来自英国的 Freeman Dyson (1923-)。 在二十世纪物理殿堂的璀璨群星中 Dyson 当然远不是最杰出的, 但那个午后他和 Montgomery 的世界线在高等研究院的短暂交汇, 却是科学史上一段令人难忘的佳话, 对于 Riemann 猜想的研究来说也是一个奇峰突起的精彩篇章。
Chowla 是一位交际高手, 他一边和 Montgomery 喝茶聊天, 一边仍能眼观六路、 耳听八方。 Dyson 刚一进门就被他发现了, 于是他问 Montgomery: “你见过 Dyson 吗?”, Montgomery 说没有, Chowla 就说我给你引见一下。 Montgomery 心想自己做的东西和 Dyson 八杆子都打不着, 再说喝完茶就走人了, 何必还要特意打扰 Dyson 呢? 就说不必了。 但 Chowla 却是一个从来不把 “不” 字当成答案的家伙, 当下二话不说就把 Montgomery 拽到了 Dyson 跟前 (谢谢 Chowla!)。
就这样 Dyson 和 Montgomery 攀谈了起来。 遵循着此类谈话的固有模式, 年长的 Dyson 问起了年轻的 Montgomery 最近在研究什么? Montgomery 就把自己对 Riemann ζ 函数非平凡零点分布的研究叙述了一下。 Dyson 礼貌地听着, 他对这一领域并不熟悉。 连本领域的顶尖高手 Selberg 都未曾发表具体看法, Montgomery 也并不指望对一个物理学家的这番泛泛介绍会得到比礼貌地点点头更多的回应。
但当他介绍到自己所猜测的密度函数 ρ(t) = 1-[sin(πt)/πt]2 (详见 第十六节) 时, Dyson 的眼睛猛地睁大了!
因为这个让 Montgomery 找不到北, 甚至连 Selberg 也看不出端倪来的密度函数对 Dyson 来说却一点也不陌生, 那是所谓的随机厄密矩阵 (random Hermitian matrices) 本征值的对关联函数。 物理学家们研究这类东西已经有二十年了!
而且 Dyson 本人也早在十年前就系统地研究过随机矩阵理论, 是这一领域公认的先驱者之一。 即使找遍整个世界, 也不可能找到一个比 Dyson 更合适的人来和 Montgomery 共喝那杯下午茶了。 他们的相遇本身就是一个幸运的奇迹[注一]。
十八. 随机矩阵理论
身为理论物理学家的 Dyson 如何会研究起随机矩阵理论来的呢? 这当然还得从物理学说起。
我们知道, 在物理学上可以严格求解的问题是少之又少的。 而且物理理论越发展, 可以严格求解的问题就越少。 举个例子来说, 在 Newton 引力理论中二体问题可以严格求解, 但一般的三体问题就不行[注二]; 到了广义相对论中连一般的二体问题也解不出了, 只有单体问题还可以严格求解; 而到了量子场论中更是连单体问题也解不成了 (因为根本就不存在单体问题了)。
另一方面, 现实物理中的体系却往往既不是单体, 也不是二体或三体, 而是多体。 这 “多” 字少则十几、 几十 (比如大一点的原子、 分子), 多则 1023 (千万亿亿) 或更多 (比如宏观体系)。 很明显, 对现实物理体系的研究离不开各种各样的近似方法。 这其中很重要的一类近似方法就是统计方法, 由此形成了物理学的一个重要分支: 统计物理 (statistical physics)。
在统计物理中, 人们不再着眼于对物理体系的微观状态进行细致描述 (因为这种细致描述不仅无法做到, 而且对于确定体系的宏观行为来说是完全不必要的), 取而代之的是 “系综” (ensemble) 的概念。 所谓 “系综”, 指的是满足一定宏观约束条件的大量全同体系的集合, 这些体系的微观状态各不相同, 但满足一定的统计分布, 而我们感兴趣的体系的宏观状态则由相应的物理量在这些体系上的平均值——即所谓的系综平均值——所给出。
在传统的统计物理中, 组成系综的那些全同体系具有相同的哈密顿量 (Hamiltonian)[注三], 只有它们的微观状态才是随机的。 但随着研究的深入, 物理学家们开始接触到一些连这种方法也无法处理的物理体系, 其中一个典型的例子就是由大量质子和中子组成的原子核。 这种体系的相互作用具备了所有可以想象得到的 “坏品质” (比如耦合常数很大, 不是二体相互作用, 不是有心相互作用, 等等), 简直可以说是 “五毒俱全”。 对于这种体系, 我们甚至连它的哈密顿量是什么都无法确定。 这样的体系该如何处理呢? 很显然还是离不开统计的方法, 离不开系综的概念。 只不过以前在系综中哈密顿量是已知的, 只有各体系的微观状态是随机的, 现在却连哈密顿量也不知道了。 既然如此, 那就 “一不做、 二不休”, 干脆把哈密顿量也一并随机化了。 由于在量子理论中哈密顿量可以用矩阵来表示, 因此这种带有随机哈密顿量的系综可以用随机矩阵理论 (random matrix theory) 来描述。 这一点最早是由美籍匈牙利数学及物理学家 Eugene Wigner (1902-1995) 于 1951 年提出的[注四]。
当然, 把哈密顿量随机化不等于说对哈密顿量的结构就没有任何限制了。 二十世纪六十年代初, 与 Montgomery 在茶室里偶遇的这位 Dyson 对随机矩阵理论进行了深入研究, 并在 1962 年一连发表了五篇非常漂亮的论文。 这些论文在随机矩阵理论的发展史上具有奠基性的作用。 在这些论文中, Dyson 证明了由随机矩阵理论所描述的物理体系可以按照其在时间反演变换 T 的作用下的变换性质, 而分为三种类型:
- 如果体系不具有时间反演不变性, 则体系的演化算符为幺正矩阵 (unitary matrices)。
- 如果体系具有时间反演不变性, 且 T2 = I (I 为单位矩阵), 则体系的演化算符为正交矩阵 (orthogonal matrices)。
- 如果体系具有时间反演不变性, 且 T2 = -I, 则体系的演化算符为辛矩阵 (symplectic matrices)。
这里 Dyson 用演化算符 U 取代了哈密顿量 H, 这两者之间由 U=exp(-iHt) 相联系。 用演化算符的好处是它的参数空间是紧致 (compact) 的。
除了利用对称性对体系演化算符的结构进行分类外, 还有一个需要解决的问题, 就是哈密顿量的分布函数。 Dyson 引进的是 Gauss 型分布, 这是数学物理中比较常见的一种分布。 在这种分布下具有上述三种对称性的系综分别被称为: Gauss 幺正系综 (Gaussian Unitary Ensemble——简称GUE)、 Gauss 正交系综 (Gaussian Orthogonal Ensemble——简称GOE) 和 Gauss 辛系综 (Gaussian Symplectic Ensemble——简称GSE)。
Dyson 在得知了 Montgomery 的密度函数时猛然想起的 “随机厄密矩阵” 所描述的正是这三种系综中的一种——即 Gauss 幺正系综——的哈密顿量 (因为 Gauss 幺正系综的演化算符是幺正的, 所对应的哈密顿量则是厄密的), 它的几率测度定义为 Gauss 型分布:
P(H) dH = C exp[-tr(H2)/2σ2] dH
其中 C 为归一化常数, H 为体系的哈密顿量, σ 为标准差 (通常取为 2-1/2)。
有了哈密顿量, 接下来要关注的当然就是能级分布。 对于一个量子体系来说, 能级分布无论在理论还是观测上都是极其重要的性质。 这也是随机矩阵理论中物理学家们最感兴趣的东西之一。 物理学家所说的能级用数学术语来说就是哈密顿量的本征值 (eigen value)。 那么随机厄密矩阵的本征值是怎样分布的呢? 分析表明, 一个 N 阶随机厄密矩阵的本征值的分布密度为:
P(λ1, ... , λN) = C exp[-Σiλi2] Πj>k(λj-λk)2
其中 λ1, ... , λN 为本征值, C 为归一化常数。
通过对这一分布密度的积分, 我们可以计算出随机厄密矩阵本征值的各种关联函数。 但是这些关联函数的表观复杂程度与本征值的平均间距有很大关系, 因此我们要先对本征值做一点处理, 以便简化结果。 这一处理所依据的是 Wigner 曾经证明过的一个结果, 那就是当矩阵阶数 N→∞ 时, N 阶随机厄密矩阵的本征值分布趋近于区间 [-2(2N)1/2, 2(2N)1/2] 上的半圆状分布, 即:
P(λ) dλ = (8N-λ2)1/2 dλ/4π
其中 P(λ) dλ 为区间 (λ, λ+dλ) 上的本征值个数。 这一规律被称为 Wigner 半圆律 (Wigner semicircle law)。 利用这一规律, 我们可以对本征值做一个标度变换, 引进:
μ = λ(8N-λ2)1/2/4π
可以证明 (请读者自己证明), 这一变换就像我们在 第十六节 中对 Riemann ζ 函数零点虚部所做的处理将零点的平均间距归一化那样, 将本征值的平均间距归一化为了 Δμ~1。 在这种间距归一化的本征值下, 关联函数的形式变得相对简单, 其中对关联函数的计算结果为:
P2(μ1, μ2) = 1 - [sin(π|μ2-μ1|)/π|μ2-μ1|]2
看到这里, 大家想必也和 Dyson 一样看出来了, 随机厄密矩阵本征值的对关联函数正是我们在 第十六节 中介绍过的, Montgomery 所猜测的 Riemann ζ 函数非平凡零点的对关联函数! 当然, 那时候 Montgomery 用的不是像 “对关联函数” 这样摩登的术语, 事实上 “对关联函数” 这一术语 Montgomery 在与 Dyson 交谈前连听都没听说过, 他自己用的是像 “我正在研究零点间距” 那样土得掉渣的 “白话文”。
有些读者可能会提出这样一个问题, 那就是哈密顿量的分布为什么要选择成 Gauss 型分布? 对于这个问题, 实用主义的回答是: Gauss 型分布是数学上比较容易处理的 (不要小看这样的理由, 当问题复杂到一定程度时, 这种理由有时侯是最具有压倒性的); 稍为深刻一点的回答则是: Gauss 型分布在固定的 |H|2 系综平均值及标准差下具有最大的熵, 换句话说它所描述的是在一定的约束之下具有最大随机性的体系; 但最深刻的回答却是: 我们其实并不需要特意选择 Gauss 型分布! 随机矩阵理论的一个非常引人注目的特点便是: 在矩阵阶数 N→∞ 的极限下它的本征值分布具有普适性 (即不依赖于哈密顿量的特定分布)。 正是这种普适性使得随机矩阵理论在从复杂量子体系的能级分布到无序介质中的波动现象, 从神经网络系统到量子混沌, 从 Nc→∞ 的 QCD 到二维量子引力的极为广阔的领域中都得到了应用。
但即便把随机矩阵理论在所有这些不同尺度、 不同维度、 不同领域中的应用加在一起, 似乎也不如它与 Riemann ζ 函数非平凡零点分布之间的关联来得神奇。 Montgomery 曾经为不知道自己的结果预示着什么而苦恼, 现在他知道了那样的结果也出现在由随机矩阵理论所描述的一系列物理现象之中。
但这是解惑吗? 这与其说是解惑, 不如说是一种更大的困惑。 像 Riemann ζ 函数非平凡零点分布这样最纯粹的数学性质, 怎么会与像复杂量子体系、 无序介质、 神经网络之类的最现实的物理现象扯上关系呢? 这种神奇的关联本身又预示着什么呢?
注释
- 有意思的是, 在与 Montgomery 的这次 “茶室邂逅” 的前一年 (即 1972 年), Dyson 刚刚写过一篇题为 “Missed Opportunity” (“错过的机会”) 的文章, 叙述了科学史上由于数学家与物理学家之间的交流不够而错失发现的一些事例。
- 这里的 “单体”、 “二体”、 “三体” 等指的都是点状分布或可视为点状分布的体系。
- 哈密顿量是决定体系动力学行为的一个很重要的物理量。 在量子理论中, 体系的能级由哈密顿量的本征值所决定。
- 当然, 在随机矩阵本身的提出上, 数学家还是要先于物理学家。 随机矩阵在数学上最早是 1928 年由苏格兰统计学家 John Wishart (1898-1956) 提出的。