如果你要问的是教科书式的答案,那我记得应该是这几条:
1、“态”构成希尔伯特空间;
2、“可测量”由希尔伯特空间上的厄米算符表示;
3、态的“时间演化”满足薛定谔方程;
4、“测量”相关:态之间的内积(波函数)的模平方等于坍缩概率。
没有翻书,如果有遗漏欢迎补充。
那么怎样通俗地理解呢?
当然我不赞成向广场舞大妈科普量子力学,所以我所说的“通俗”至少是建立在高中理科物理知识基础上。
很多科普都会向你解释量子力学的理论,每个人思路不同,我也只是提供一种思路,未必适合所有人,但我希望可以启发一些人。
(你也许用到的知识包括并不仅限于:函数、向量空间、概率与平均值、牛顿力学)
*** 经典力学回顾 ***
首先,让我们仔细看看非量子力学是什么样的。原则上,到了大学学习分析力学才能系统地了解经典力学,我们这里只是大概描述一下框架。
任何力学里都有一个概念:相空间。相空间里的元素是“物理状态”,简称“态”。在经典力学里,相空间由质点的位置和动量描述,意思就是当你知道一个质点的位置和动量,你就完整地知道了它的状态。同理,如果你有很多质点组成系统,那么相空间就由每个质点的位置和状态描述,自由度就多了很多,但基本思路还是这样的。
有了“态”的概念,我们就考察它怎么变化。由于“态“涵盖了所有可能的物理信息”,所以它的变化率应该已经确定了。也就是说,我们知道了所有质点的位置和动量,我们就应该能够知道它们的加速度,否则我们的相空间就没有定义好。
怎样通过“状态”知道“状态的变化率”呢?就是通过各种力的公式,比如胡克定律,库仑定律,牛顿引力定律,磁力(洛伦兹力,依赖于速度),它们结合牛顿第二定律,就能告诉你在特定状态下所有质点的加速度。
所有这些力的公式,它们的信息可以隐含在一个量里,叫哈密顿量,你暂时不用明白它怎么来的。你需要知道的是,经典力学运作的框架就是:你知道一个相空间长什么样,然后你知道一个叫哈密顿量的东西,这个量能够告诉你在相空间里任意一处状态会随时间怎样变化。
*** 向量空间与波函数 ***
那么量子力学的理论有哪些本质上的不同呢?在以上的图像里,有一点对于“经典力学”尤为重要,那就是相空间的结构(余切丛)。量子力学主要就是相空间的结构不同,量子力学里的相空间是个线性空间,也就是中学学的向量空间。
我们来看看量子力学的相空间怎样描述状态的。作为一个向量空间,中学知识就可以告诉你,可以选取一组互相垂直的基向量,然后任何一个向量都可以用这些基向量的组合来表示。量子力学里,我们可以这样选基向量:质点在位置A是一个态|A>,质点在位置B是另一个态|B>,由于这两件事是互斥的,我们定义这两个态在相空间里是互相垂直的向量,那么我们可以把所有有确定位置的态定义为基向量。这样定义后,相空间就是一个无限维的线性空间了。
既然是向量,就可以相加。于是我们有了一个“叠加态”:a*|A> b*|B>。量子力学相空间的结构表明了这样的态是存在的。这就是科普书里说的,既在A地又在B地的状态。而这里的系数a, b就是波函数。这是一个位置的函数,位置A的函数值是a,位置B的函数值是b(此处有归一化问题,不严格)。这里只给两个位置赋了函数值,你可以给所有位置都赋一个值,就可以得到一个连续的函数,比如高斯函数,正弦函数等等。
如果你擅长向量空间,那么我们可以把一个向量用不同的基向量下的坐标表示(高中有学么?没有的话百度百科一下,不难)。上面我们用的基向量是有确定位置的态(术语是位置本征态),你也可以用别的基向量,比如有确定动量的本征态。用群论可以证明,这两个本征态之间的变换就是傅里叶变换,这句话的意思就是说,有确定动量的态的波函数是一个简谐波(正弦波余弦波这种)。你现在也许没法证明,事实上本科生也基本上是把这个当结论。这个波,就是德布罗意说的波粒二象性的波。一个粒子以确定的动量运动,它同时也是一个简谐波。
*** 叠加态与可测量 ***
说了这么多波函数,那么“叠加态”究竟是什么意思呢?为什么质点可以同时存在于两个地方呢?理解量子力学,这一步很重要。我们要重新审视一些命题,比如说“质点在位置A”。在量子力学的语境里,质点的位置是个可测量,而一个可测量的值并不总是确定的。
在经典力学里,你可以构造一个相空间的函数,对于每一个状态,输出它的位置,这个位置对于该状态来说是确定的。在量子力学的相空间,只有位置本征态有确定的值,而它们的叠加没有。一个任意的态,它的位置,或任何其它可测量,只有“平均值”,做平均的权重就是波函数的平方。你可以证明,这样取的平均值,是符合经典力学的方程的,也就是说经典力学里我们理解的可测量,其实都是量子里的“平均值”。那么用“平均值”来描述理论,是否不严谨呢?不,事实上,如果你不做特定可测量的测量,叠加态的演化是可以严格写出的,不需要任何的取平均,我们取平均,只是为了能和经典的结论作比较,应该说在量子的级别上,取平均是一件多余的事,是为了使用一些经典概念而强加于这个理论的操作。这就是“可测量”这个概念在量子世界的纠结之处。进而,“测量”这个过程也变得纠结起来,这个后面说。
*** 时间演化 ***
量子态的时间演化,没什么好说的,就是薛定谔方程。这个方程和经典力学里的哈密顿方程非常非常相似,区别几乎就是对相空间结构和哈密顿量的本质做了重定义。这个你暂时不会有体会。
值得一提的是,薛定谔方程是“酉”的,意思就是在演化过程中没有信息丢失;换句话说,你能从更早的时间的态推导出较晚时间的态,由于没有信息丢失,通过该方程,你也可以反着推,从较晚的态推导出更早的态,和经典力学里一样。这个特征杜绝了“随机性”,因为如果随机事件发生了,那么就会有信息丢失,你就不可能进行反推。
没有随机性?你一定认为我疯了。但这就是薛定谔方程的结论。那么人们说的随机性是哪来的?下面就说。
*** 量子测量 ***
之前说到了“平均值”,既然有平均值就有概率分布,那么这个概率是什么呢?
如果我们让一个态按薛定谔方程做演化,它不会管你可测量有什么值,你永远只能算平均值,即使知道一个用于计算的概率分布,你似乎也无法检测那个概率,毕竟这个态永远不会演化成有某个特定测量值的态。也就是说这个概率分布只是用来计算出一个平均值以拟合经典结果用的,没有概率本身的意思。
但是,有一种过程,叫测量,它可以强行告诉你一个态的测量值。为什么呢?因为它可以让这个态坍缩到某一个测量值的本征态(就像向量的投影)。坍缩到哪个本征态呢?按照之前说的概率——波函数的平方,此时才把它当做一个概率来用。因此你会得到,这样一个测量过程能够得到的值,的平均值,正是我们之前算的那个符合经典力学的平均值。注意:这两个平均值的含义不同。测量的平均值是只有测量的时候才能得到的测量结果的平均值;而之前算的平均值是测量不测量都存在的,每个态都有的性质,并且其变化遵守经典力学。
是的!有两种不同的过程。一种是演化,它遵循薛定谔方程,它没有随机性;一种是测量,它以波函数的平方为概率进行态的坍缩,有随机性。
这就是哥本哈根学派的量子力学诠释。实验证实了这种诠释,如果你看过很多量子力学的科普,也许会看到“贝尔不等式”,那个就是对它的实验证实。
那么两种过程的界限是什么呢?意识。很多人认为,只有人的意识参与了过程,才产生测量。比如薛定谔的猫,如果人不看一眼盒子里,猫是出于生与死的叠加态的;只有用人的意识观测过,猫的态才会坍缩到生死确定的态。
哈哈,这种观点出来后,可算让民众多了不少茶余饭后的谈资。多新鲜,原来科学最后也变成了唯心主义。
后续的发展,我不能很确定的说,因为我不是这个方向的(量子信息),而且你现在的知识储备就更难理解了。只能告诉你,以上对“测量”的看法作为谈资可以,严肃的科学应该已经不采取这个思路了。
*** 关于名字“量子” ***
讲了这么多理论基础,怎么都没有讲到“量子”的意思?不是说量子力学里什么都是一份一份的嘛?其实这么说不准确。如果单看非相对论量子力学,有很多东西都是非量子化的,只有“束缚态”有量子化现象。束缚态就是粒子在一个势里面,由于能量的不足,空间上受到束缚。这样的状态下,解微分方程可以得到的解往往是离散的,就好像两端固定的弦有离散的可取的波长一样,或者像四周固定的鼓有特定的一些离散的频率一样。量子化这个现象本身,是微分方程理论就可以得出的,只是量子力学引入了“波函数”概念,把态的方程变成了波函数的微分方程,因此才“变出了”量子化。
到了相对论量子力学——量子场论后,你会发现“粒子”这样一个离散的概念也是一种量子化的产物。早期爱因斯坦发现的光量子就是一个例子,只是当时还没有理论可以描述它。这后面的理论就真的不是你现在可以懂的了。
--------- High-Level 内容的分割线 (以下内容需要学过量子力学的本科生才适合阅读)---------
但是如果你想知道构造新的量子理论时所遵循的规则,比如弦论也必须遵循的基本游戏规则,我想表述会很不一样。具体的我也还没有总结,但我有以下几个体会:
首先我认为测量公理应该不是一个基本公理,或者说它即使是对的,对一个理论来说也没有框架级的重要性,应该说是一个当人类面临测量的时候可以采用的一个有效定理。
然后,态的“时间演化”不会被单独强调,因为1、时间只是时空的一个分量,从狭义相对论的角度来说它没有单独的重要性;2、演化其实只是“时间平移操作”,从对称性的角度来说,它和“把时间平移生成元定义为能量”是等价的。即如果你把能量(哈密顿量)定义为时间平移生成元,自然就有薛定谔方程。
由上一点你也可以看出,也许对称性会扮演很重要的角色。但是对称性应该说不属于“框架”,而是“内容”,即你可以在理论中加入或拿走各种对称性,只要理论自洽就行,任何对称性的存在都不是原则性的。
另外,所谓“可测量”,其实就是对称性的诺特荷和诺特流,对于酉对称性(温伯格在第一册证明了量子态的对称性只能是酉且线性的或反酉且反线性的,且后者貌似只有时间反演这个离散对称性,因此这不是一个很特殊的要求),它自然是厄米的,所以也无需多言。
这样算下来,至少这个框架在外观上会很不一样。如果有人有看过类似的整理的比较好的规则,欢迎请教。