深度科普|从线性代数到量子力学(6):量子力学原理初体验

深度科普|从线性代数到量子力学(6):量子力学原理初体验


本文是深度科普系列《从线性代数到量子力学》的第6课。

了解本系列其他文章,请收藏目录:

目录:从线性代数到量子力学zhuanlan.zhihu.com图标

或关注专栏:

在数学之外体验数学zhuanlan.zhihu.com图标

0) 开篇语


这是本系列的第6课,也是最重要的一课。

因为本课结束之后,我们就终于要正式踏进量子力学的大门了。

在本系列的前5课中,我们知道,量子力学主要关注的对象,是具有向量性质的抽象的态矢量,那些经典物理量的信息,都以概率形式包含在态矢量之中。

但我们在前面看到的例子,要么是一些虚构的思想实验,要么是一个几乎只在量子世界里出现的自旋,这都不是我们所熟悉的经典物理量。

那么,我们更为熟悉的经典物理量、比如动量、能量等,又是怎么和态矢量联系起来的呢?

这其实就触碰到量子力学的基本假设了,但讲这个基本假设之前,我们要先回到线性代数中,去找两位老朋友叙叙旧。


1) 叙旧:特征值与特征向量


我们要见的这两位老朋友,是特征向量特征值

也许是出于严谨的考虑,大部分线性代数教材没有告诉我们矩阵、特征向量和特征值有什么几何意义,但这个其实没有什么神秘的,几句话就能说清。

我们先说矩阵本身的几何意义,一个直观理解就是,矩阵通过与向量相乘的形式作用在向量上,对向量进行一种变换“操作”。比如两个最简单的例子:

一个是旋转矩阵:

\bm R_{\theta}=\begin{bmatrix} \cos\theta&\sin\theta\\ -\sin\theta&\cos\theta \end{bmatrix}

它作用在向量上时,会把向量旋转 \theta 角而不改变其大小:

另一个是乘了一个系数的单位矩阵:

{\bm{\it\Lambda}}=\begin{bmatrix} \lambda&0\\ 0&\lambda \end{bmatrix}

它作用在向量上时,会伸缩一个向量而不改变其方向(这个很明显,就不画图了 )。

但绝大多数矩阵,对向量的“操作”都更复杂,从几何结果来说,不仅同时包括了上面两种,而且在不同的向量上会造成不同的旋转角度和伸缩系数。

不过,对于一些矩阵而言,不管它作用在其他向量上时会造成怎样的改变,我们总是能找到一些特殊的向量,使得这个矩阵只能改变其“大小”,而不改变其方向。

这组向量,就是这个矩阵的特征向量,而它的“大小”改变的比例,就是相应的特征值

有了这个认识,我们就可以回到量子力学中,理解整个量子力学最基本的假设,并且将量子态与经典物理量联系起来了。


2) 本征值、本征态与量子测量


我们在第1课提到过,一个经典物理量会对应一组本征态,又叫本征矢(Eigen Vector)。

看到它的英文名,我们一眼就能认出来,它其实就是线性代数中所说的特征向量,只是在量子力学中换了一个中文翻译而已。

既然一组本征态的数学本质就是一组特征向量,那么它背后对应的那个物理量,在量子力学中是不是也会对应一个矩阵呢?

的确是这样,只不过,这个矩阵换成了一个更抽象也更广义的概念,叫作算符(Operator)。

如果某个物理量符号为 P ,那么它的算符就是 P 上加个小尖帽,记作 \hat{P} (读作P-hat )。

现在算符是有了,但它的物理意义是什么呢?这个问题的答案,首先体现在测量当中:

当我们对一个处于量子态 \left|\psi\right> 的物理对象(假设是一个微观粒子 )测量物理量 P 的时候,体现在数学上,就是 P 的算符 \hat{P} 作用在 \left|\psi\right>

当然,这句话看起来似乎让我们的问题变得更抽象了,但没关系,我们下面一步一步来解释。

首先,我们把“算符 \hat{P} 作用在 \left|\psi\right> 上”这句话翻译成线性代数语言:

\left|\psi\right> 类比成一个列向量 \bm\alpha ,将 \hat{P} 类比成一个矩阵 \bm A ,那么上面引号里那句话,其实就是矩阵 \bm A 左乘向量 \bm\alpha ,或者说 \bm A 作用在 \bm\alpha 上。

我们知道,通常情况下,矩阵作用在向量上,会将它变换成另一个向量,类比到量子力学中,这就意味着算符作用在一个态矢量上,会得到另一个态矢量(只不过改变态矢量的方式和线性代数中矩阵改变向量的方式有些不同,我们马上会看到 )。

而回想起前几课提到的:当我们去测量一个物理对象(比如前几课出现过的虚构的薛定谔的猫、虚构的量子糖、现实的SG实验中的电子…… )的某个物理量时,通常会改变它的量子态。

这就把矩阵对向量的作用、与测量物理量时算符对态矢量的作用联系起来了。

但这还是一个比较粗糙的认识,接下来,我们将要来看看量子测量和线性代数之间更多相似的细节。


我们知道,有某些特殊情况下,测量一个物理对象的某个物理量 P 时,不会改变它的量子态,这种情况,就是这个对象的量子态正好是 P 的本征态,也就是算符 \hat{P} 的本征矢。

而这也可以用线性代数来解释:

如果向量 \bm\alpha (假设是列向量 )是矩阵 \bm A 的特征向量,那么 \bm A 左乘 \bm\alpha ,会得到:

\bm A\bm\alpha=\lambda\bm\alpha

而我们前面解释过,它的几何意义就是:经过矩阵作用后,向量的方向不会改变,而只会根据特征值缩放大小。

到了量子世界中,这样的情况也类似(注意作者的用词 ):

如果一个粒子所处的量子态是某个物理量的本征态,那么该物理量作用在上面(也就是对这个粒子测量该物理量 ),原来的本征态的“方向”也不会变。

那么,它的“大小”是否也会像线性代数一样,乘以一个特征值?

问到这里,量子力学就开始体现出和线性代数的一些不同之处了。

首先,量子力学中规定:态矢量不会有“大小”的概念(后面我们会解释为什么这么规定 ),一个态矢量乘以一个数之后,得到的仍然是同一个态矢量。

也就是说,一个态矢量只取决于它的“角度”,这也就能解释,为什么算符作用在它的本征态上时这个本征态不会被改变了。

但我们知道,线性代数中,矩阵乘以特征向量后会出现一个特征值改变向量的大小,而在量子力学中,本征态不会改变“大小”,那么问题来了:这个特征值被藏到哪去了

这个问题的答案,正好就是联系量子和经典物理的桥梁:

物理量算符作用到本征态上得到的特征值,就是经典世界中测量到的物理量的值

比如有一个 x 方向上确定动量的粒子(这意味着它的量子态正好是动量算符 \hat{p}_x 某个本征态 \left|p_x\right> ),去测量它的动量时,测得的动量值 p_x ,就是相应的特征值。

上面那句话写成数学表达式,就是:

\hat{p}_x\left|p_x\right>=p_x\left|p_x\right>

(请与 \bm A\bm\alpha=\lambda\bm\alpha 一起对照着欣赏一下 )

也就是说,当粒子的量子态处于动量算符的某个本征态 \left|p_x\right> 时,我们去测量它的动量后, \left|p_x\right> 仍然不会改变,但特征值信息会被“释放”出来,表现成测量仪器上的读数 p_x

这样,似乎只存在于想象中的不可捉摸的量子幽灵(动量算符 \hat{p} 、态矢量 \left|p_x\right> )和经典物理中可以“真实”测量到的经典物理量(本例中的动量 p_x )就联系起来了。

这里顺便说一下,在量子力学中,特征值被翻译为本征值(英文仍然是 Eigen Value )。我们现在既然来到了量子世界,也就入乡随俗用这个翻译了。


现在说完了算符作用在相应本征态上的情况,我们自然要想到另一个问题:非本征态的情况

我们先看线性代数中的一个简单例子:

假设矩阵 \bm A 有不同的特征值 \lambda_1,\lambda_2,\cdots,\lambda_n ,以及相应的特征向量 \bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_n ,那么根据线性代数知识,我们知道这些特征向量构成一组线性无关的基底。

又假设某向量 \bm u\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_n 线性表示为:

\bm u=c_1\bm\alpha_1+c_2\bm\alpha_2+\cdots+c_n\bm\alpha_n

那么,当 \bm A 作用在 \bm u 上时,我们会得到一个新向量:

\bm A\bm u= \lambda_1c_1\bm\alpha_1+\lambda_2c_2\bm\alpha_2+\cdots+\lambda_nc_n\bm\alpha_n

而这个新的向量,仍然是这组特征向量的某个线性组合,而没有变成 \bm A 的特征向量之一

那么,同样的一幕,在量子力学中会不会上演呢?

比如,对不处于动量本征态的粒子测量动量时,会不会得到另一个非本征态呢?

如果我们还记得前5课中出现过的那些例子(猫、量子糖、SG实验中电子的自旋…… ),我们会很快得出结论:不会

因为正如我们在前5课中反复看到的那样,如果一个物理对象的量子态处于某个物理量 P非本征态,那么对它测量 P 时,它的量子态会随机坍缩到该 \hat{P} 的一个本征态 \left|P_k\right> 上。

当然,这里需要加上一句:随机坍缩发生后, \left|P_k\right> 对应的本征值 P_k 会作为测量结果的数值信息被“释放”出来


这就是用(改造后的 )线性代数语言描述态矢量与经典物理量之间关系的方式。

不过,写到这里,作者自己都能感觉到,对于一个爱好者(虽然是进阶的 )来说,前面一堆数学名词有些抽象,所以各位大约已经看得有点疲惫了。

这样吧,我们马上来看两个物理上的例子,感受一下算符、本征态和本征值之间的关系。


3) 两个例子


第一个例子:SG实验中的自旋磁矩

我们在第4课的SG实验中看到,银原子通过SG实验装置后,泾渭分明地分裂成了两束,也就是测量它的 z 方向自旋时,银原子的量子态坍缩到 \left|z_+\right>,\left|z_-\right> 两个本征态上。

\left|z_+\right>,\left|z_-\right> 其实是不可直接观察的,而我们“看见”的两束银原子,其实代表了两个具体的自旋磁矩的值。

比如处于 \left|z_-\right> 的银原子,它之所以向下偏转,是因为它受到了一个向下的磁场力 -F_z ,这个磁场力就来自于 z 方向磁矩 -\mu-F_z=-\mu\frac{\partial B_z}{\partial z}

这样,观察到银原子向下偏转,其实就相当于测出了自旋磁矩的值 -\mu ,而这正是 \left|z_-\right> 对应的本征值。


第二个例子:氢原子能级

还记得我们第1课开头提到的、关于氢原子能级背后的数学和物理“本质”的问题吗?

现在,我们可以尝试着给出一个大概的解释了。

我们知道,氢原子的核外电子具有分立的能级,并且会在这些能级之间发生随机跃迁。

但是,作为一群没有系统学习过量子力学的票友,我们对氢原子能级的认识,大多还停留在玻尔旧量子论的阶段,只知道它由于某种神秘原因,必须是某个值的整数倍。

而现在认识了本征值、本征态,我们就可以给出一个(至少在数学上 )比较自然的解释了:

而当我们关注一个粒子的能量的时候,就需要找出一个能量算符,它在量子力学中的正式名称叫作哈密顿算符(Hamiltonian),记作 \hat{H}

在有势能束缚的条件下,它也对应着一组离散的本征值和本征态,这就是我们熟悉的能级

将哈密顿算符作用在某个态矢量 \left|\psi\right> 上时,就可以写成:

\hat{H}\left|\psi\right>=E\left|\psi\right>

而在坐标表象(以后解释这个词 )下,能量算符可以表示为:

\hat{H}=-\frac{\hbar^2}{2m}\frac{\partial^2}{\partial x^2}+V(x)

(其中 V(x) 代表势能 )

(以后我们会慢慢解释,为什么代表能量的算符会是这个样子 )

代入上式,我们就得到了:

\left[-\frac{\hbar^2}{2m}\frac{\partial^2}{\partial x^2}+V(x)\right]\left|\psi\right> =E\left|\psi\right>

而我们在第1课开头曾经提到过,波函数 \psi(x,t) 也是态矢量 \left|\psi\right> 的一种形式(以后再解释为什么 )。

于是我们可以将态矢量 \left|\psi\right> 写回波函数 \psi(x,t) 的形式,并且只考虑它与时间无关的部分(这可以通过分离变量实现,以后解释 ),就得到:

\left[-\frac{\hbar^2}{2m}\frac{\partial^2}{\partial x^2}+V(x)\right]\psi(x) =E\psi(x)

这就是定态薛定谔方程。

对于球对称的氢原子附近的电势场而言,它可以写成球坐标形式,再代入势能项 V(r)=-\frac{1}{4\pi\epsilon_0}\frac{e^2}{r} ,并新增电子-原子核体系的转动动能项 \frac{\hat{\bm L}^2}{2\mu r^2},可得:

\left[ -\frac{\hbar}{2\mu}\frac{1}{r^2}\frac{\partial}{\partial r} \left(r^2\frac{\partial }{\partial r}\right)+\frac{\hat{\bm L}^2}{2\mu r^2}-\frac{1}{4\pi\epsilon_0}\frac{e^2}{r} \right]\psi=E\psi

(左边那一长串合起来仍然是哈密顿算符 \hat{H} ,虽然看起来复杂了点…… )

了解过偏微分方程的同学会知道,当给定了一定区域的边界条件时,这个方程会有一系列离散的特解 \psi_n

而从向量的观点来看,这些特解 \psi_n 其实就是哈密顿算符的本征态 \left|E_n\right> ,而每个本征态对应的本征值 E_n ,就是我们熟知的氢原子能级了。

从这个结果来看,线性微分方程和代数方程组其实是相通的,但我们知道,微分方程是微分算子作用到函数上,而代数方程组是矩阵作用到向量上,这两者应该如何类比呢?

这个我们下节课再说,现在关于量子力学原理说得太多,信息量太大,我们该来一段总结了。


4) 总结与预告


其实,从第1课一路走到本课,我们已经可以模糊感觉到一个结论:

测量的概念是量子力学在物理上的核心与精髓——王正行《量子力学原理(第二版)》

所以,一旦理清楚测量问题的数学描述,量子力学的数学框架就能在我们脑中浮现出来了。

那我们就来总结一下这种数学描述方式吧:

一个经典物理量 P 通常会对应一个算符 \hat{P} ,而一次测量过程就是算符作用到态矢量上面的过程,就像线性代数中矩阵作用到向量上一样。

测量结束后,被测物理对象的量子态会随机坍缩到 \hat{P} 的某个本征态 \left|P_k\right> 上(如果被测对象在测量前就处于某个本征态上,那么测量过程将不会改变它 )。

假设测量前的态矢量 \left|\psi\right>\hat{P} 的本征态的线性组合:

\left|\psi\right>=\sum_i{c_i\left|P_i\right>} \quad \left(\sum_i{|c_i|^2}=1\right)

那么测量后,量子态坍缩某个到 \left|P_k\right> 上的概率为 |c_k|^2

而坍缩发生后,我们会在经典世界里得到一个测量结果 P_k ,这就是 \left|P_k\right> 对应的本征值。

这里顺便提一个很多人关心的问题:量子态随机坍缩到本征态的这个过程是怎么发生的

很可惜,对于这个问题,当前的物理学并没有答案,或者说暂时不关心答案。因为即使这个问题对我们理解一些深层次规律可能比较重要,也并不需要那么急迫地去弄明白。

当然,我们可以就此展开丰富的想象、去构思一篇科幻小说,但那最终也只能是想象。如果有人言之凿凿地告诉你他知道正确答案,那他一定是民科……

真正具有科学精神的人,会大方地承认他不知道的事情

所以还是让我们回到量子力学本身吧,因为我们还有很多重要且可以解答的问题,比如这个:

在氢原子能级的例子中我们看到,对于一个线性微分方程而言,微分算子同样也有本征值和本征态(也就是微分方程的一组特解 )的概念。

而我们知道,代数方程组的未知数是离散的数组(向量 ),但微分方程的未知函数却是连续的,我们又该怎么理解它的向量性质呢?

下一课,我们就要来尝试理解这个问题。

从线性代数到量子力学(7):从傅里叶级数的“几何意义”说起zhuanlan.zhihu.com图标

编辑于 2020-02-29

文章被以下专栏收录