几何观点下的狭义相对论

(本文内容与上一场live:并不很难的狭义相对论互相补充。基础的,简单有趣的内容放live实时互动,更高要求的,需要自己思考的内容放专栏。这样效果比较好。)

=====================================================================

第一部分演化观点与几何观点


上一场live里面,我推导了狭义相对论主要的理论框架及其背后的思想,物理图像。并且我在最后提到,狭义相对论的现代语言应该是纯几何的。但由于时间所限,我在live中并无涉及任何几何相关的知识。现在,这篇文章将与大家分享在几何观点下的狭义相对论。

要真正理解狭义相对论,最关键的点在于,要把时间和空间真正看成是平权的对象(平权,并不是相同,我们稍后看)。

把时间和空间看成平权的对象,这是一句含糊的话。在相对论出现的早期,事实上人们也并没有一套很好的语言来表达这样的思想,所以在讲相对论的时候往往是借助于大量参考系,对具体问题的讨论则变成大量参考系之间一堆令人头晕脑胀的坐标变换。这样的做法显然是不够简洁也不够本质的。而之所以会陷入到这种不聪明的陷阱中,是因为我们在早期仍习惯性地试图用演化而不是几何的观点来看待物理过程。

到底什么是我这里所谓的(含时)演化的观点以及(时空)几何的观点呢。请看下图。

这幅图有两种看法,一种看法是:这是二维空间沿着时间轴演化的一个令人眼花缭乱的动态过程。这是演化的观点。另一种看法是,这是静止在一个三维时空里的一堆不变的白菜。这是几何的观点。

这两种看法的区别是,第一种里的时间像一段视频的进度条,独立于空间而存在。第二种则将时间看成是屏幕外的一条独立坐标轴,与两个空间轴共同组成一个三维时空坐标。

我说到这里不知道大家对这两种看法有没有一些体会。如果你直到现在还是觉得这两种看法并没有什么本质不同,那也不奇怪。因为在牛顿力学中,它们就是没有什么本质区别的。因为在牛顿力学中,时间是绝对的。这句话的意思是,我们只能以一种方式来对白菜进行切片。这样的话,第一种和第二种的确没有什么本质区别。第一种像电影胶片一样把一帧帧的静态图片捋成一串,第二种则像书一样把一堆静态图片叠成一垛。仅此而已。

但,假如,我们可以用不同的方式对白菜进行切片呢?我可以沿着原来的方向切片,我还可以稍稍转动一个角度,沿着另一个方向切片?这时候,每一帧图片就完全改变了。在第一种看法下,看起来一切都变了。但在第二种看法下,我们都知道,白菜还是那个白菜。


(也许我们直觉上都会同意第二种看法更接近本质。但深究原因的话,为什么我们它就更本质呢?答案:第一,它更简洁。第二,也是最关键的,因为它包含更多的不变性,它可以不依赖于对白菜进行切片的方式。)

相对论到底是什么? 相对论无非是想告诉你,其实时间轴真的不是超然物外的。时间和空间是相对的,是可以互相转化,旋转的。之所以以前时间一直没有和空间进行转化,旋转,只是因为我们的速度太慢了。注意不到。但只要速度足够快,时间和空间的相互转化就开始主导我们观测的物理现象了。这时候原先那些在低速三维空间中看起来不变的物理量就无法继续不变啦。所以我们必须用第二种方式来看待物理量,把物理量推广到四维时空去。用四维的不变白菜来刻画世界。


--------------------------------------------------------------------------------------------------------------------------

第二部分:旋转


那么问题来了,怎么找到四维不变白菜呢?

还好有个现成的~我们在之前已经证明过

ds^2 = c^2dt^2 - dx^2 - dy^2 -dz^2

在洛伦兹变换

\begin{align*}
&  x' = \frac{x - vt}{\sqrt{1 - \frac{v^2}{c^2}} }  \\
&y' = y\\
&z' =z\\
&t' = \frac{t - \frac{v}{c^2}t}{\sqrt{1 - \frac{v^2}{c^2}} }  \end{align*}

下保持不变。

那这样如果我们把ds定义为四维时空的白菜,啊呸,间隔的话(三维空间叫距离,四维时空叫间隔),我们就架构起了一个在洛伦兹变换下不变的几何。也就架构起了一个不依赖于参考系的几何。

值得一提的是,在这样的几何中,dt^2dx^2, dy^2, dz^2永远相差一个符号。这个负号使得时间与空间平权但并不完全相同,也使得这样的几何与传统的欧几里得几何有所不同。这样的几何叫闵可夫斯基几何,有些人也喜欢叫双曲几何。因为在这个几何中和原点间隔相同的点的集合是一条双曲线


c =c^2 t^2 - l^2, ( l^2 = x^2 + y^2 +z^2)

同时,如果我们令tanh(\theta) =\frac{v}{c}的话,原来的洛伦兹变换公式 (暂时忽略y, z, 因为它们不萌) 就可以变成:

\begin{align}
&x' = x cosh(\theta) + ct sinh(\theta)\\
&t' = tcosh(\theta) - \frac{x}{c}sinh(\theta)
\end{align}

(tanh, sinh, cosh, 分别是双曲正切,双曲正弦,双曲余弦。cosh^2 - sinh^2 = 1, tanh = sinh/cosh, 利用这两个式子,上面这个很容易证明。)


不知道这个公式有没有勾起大家美好的回忆,反正我马上就想到在普通的欧几里得空间中有一个

\begin{align}
&x' = x cos(\theta) + y sin(\theta)\\
&y' = ycos(\theta) - xsin(\theta)
\end{align}

它表示在欧几里得几何中把坐标轴旋转\theta角的操作。

所以,所谓的洛伦兹变换,其实真的是在做一个“旋转”操作。只不过这个旋转是作用在双曲几何上的,是一个时间轴和空间轴的旋转。

所以,在相对论里面,我真的可以转过一个角度,沿着另一个方向对白菜进行切片,这个角度的大小取决与速度与光速的比值。

所以,每一帧图片都完全改变了。于是长度收缩了,时间变慢了。

所以,什么长度收缩呀,时间变慢呀。根本没有这么玄乎。不过就是把四维时空坐标系“旋转”了一个角度,时间和空间重新线性组合了一下。于是四维矢量dx_{\mu=0,1,2,3 } = (cdt, dx, dy, dz) 在时间轴上的分量t ,空间轴上的分量x, y, z相应改变了而已。但s依然是不变的。(注意,它是个标量,ds=\sqrt{c^2dt^2-dx^2-dy^2-dz^2})

---------------------------------------------------------------------------------------------------------------------------

第三部分:双生子佯谬

从几何的角度看双生子佯谬可以多简单呢?

A是时空图中的弟弟,B是时空图中坐飞船的哥哥。

时空间隔ds^2 = c^2dt^2 - dx^2-dy^2 - dz^2

弟弟的时空间隔s_{A}^2 = c^2(t_{2}-t_{0})^2

哥哥的时空间隔s_{B}^2 = c^2(t_{2}-t_{0})^2-v^2(t_{2}-t_{0})^2

所以s_{B}<s_{A}

又因为t2时刻与t0时刻的空间间隔为零,所以t_{B}<t_{A},哥哥更年轻。

end

--------------------------------------------------------------------------------------------------------------------------

第四部分:相对论力学


所谓几何观点下的狭义相对论,无非就是把时间和空间挪一块作为一个整体的双曲几何问题来研究。找出那些在双曲几何上与参考系无关的白菜。再用那些不变量重写物理方程,这样一来物理方程就不依赖于参考系了。(然后就可以偷懒不做参考系变换啦~\(≧▽≦)/~) 。

我们现在有了s这个不变量, 怎么找出其它不变量呢?有一个立即就能想到的,光速c,光速不随参考系变化是相对论的基本假设。

它们两位一除又能得到一个不变时间,叫做固有时d\tau = \frac{ds}{c} 。它的物理意义是观测者相对于自己观测到的自己的时间。

还有一个就是静止质量m_{0},这是定死的,没什么好说的。

力学中的不变量大概就这些。然后除了不变量,我们也希望找出那些坐标变换关系和坐标轴dx_{\mu}一模一样的量,这些量叫协变矢量。找协变矢量的好处是:如果我们物理公式有这样的形式:A_{\mu}= f(B_{\mu}). 如果A,B都是协变矢量。那么在做坐标变换的时候,由于A,B的变换关系都和坐标轴的一模一样,所以A,B的变换关系显然也一模一样。于是左右抵消,我们关于协变矢量的物理公式f()就可以在坐标变换下保持不变。这样一来物理公式就不用管参考系了。跟我们开始的偷懒目的是一致的。

怎么构造协变矢量呢?最简单的办法,用四维坐标矢量dx_{\mu } 除以不变量呀!

比如用四维坐标矢量dx_{\mu } 除以固有时可以自然定义出四维速度U_{\mu} = \frac{dx_{\mu} }{d\tau}。PS:它的长度\sqrt{ U_{\mu}U^{\mu} }也是个不变量,不依赖于参考系。


乘上不变的静止质量m_{0}又能得到四维动量p_{\mu}= m_{0}U_{\mu},这个四维动量的时间分量与系统总能量联系,空间分量是动量。也就是说以前的能量和三维动量只是这个四维动量的不同分量而已。在相对论中,能量和三维动量与参考系相关,但这个四动量的平方却不依赖于参考系。从这里我们还可以得到著名的相对论的能动量关系: E^2 + p^2c^2 = m_{0}^2c^4, (经典力学是:E = \frac{p^2}{2m_{0}})

最后一个量是K_{\mu}= \frac{dp_{\mu}}{d\tau},叫做四维力。和其它小伙伴一样,它是一个四维协变矢量,满足洛伦兹变换下的与坐标的协变。



自由粒子在经典力学中的牛顿运动方程是

\frac{dp(x,y,z)}{dt}=0

这个方程很糟糕。为什么呢?因为分子分母都不是协变矢量。变一下坐标系,方程的形式会因为洛伦兹变换的关系变得面目全非。而如果像经典力学一样继续强行沿用同样的方程形式。这就相当于在该做洛伦兹变换的地方强行引入了伽利略的坐标变换。方程的物理预言自然就错了。

要把它改成洛伦兹变换下不变的方程形式,把物理量改成协变矢量就行了。因此它的修正为

\frac{dp_{\mu}}{d\tau}= 0,

它表明虽然能量和动量不一样了,但和经典情况类似的是,自由粒子在时空图上也是一条直线。


受外力的经典牛顿运动方程是

F = \frac{dp(x,y,z)}{dt}

依然不是协变的形式。应该修正为

K_{\mu}= \frac{dp_{\mu}}{d\tau}

基本上这个公式就是所有的相对论力学了。修正后,受恒定外力的粒子在相对论的时空图是一条双曲线,而经典情况是一条抛物线。


---------------------------------------------------------------------------------------------------------------------------

第五部分:相对论电动力学

和上一部分一模一样的思路。经典的麦克斯韦方程组是

\begin{align}
&\nabla\cdot\bm{E}=\frac{\rho}{\varepsilon_0}\\
&\nabla\cdot\bm{B}=0\\
&\nabla\times\bm{E}=-\frac{\partial\bm{B}}{\partial t}\\
&\nabla\times\bm{B}=\mu_0\bm{J}+\mu_0\varepsilon_0\frac{\partial\bm{E}}{\partial t}
\end{align}

此处引入一个黑科技:

F_{\mu\nu}=\left(\begin{array}{cccc}
0 & \frac{E_x}{c} & \frac{E_y}{c} & \frac{E_z}{c} \\
-\frac{E_x}{c} & 0 & -B_z & B_y\\
-\frac{E_y}{c} & B_z & 0 & -B_x\\
-\frac{E_z}{c} & -B_y & B_x & 0\\
\end{array}\right)

我并没有做任何实际操作,只是定义了一个怪模怪样的东西F_{\mu\nu},它叫场强张量。(其实此处可展开,有很多漂亮的结构,但貌似和主线关系不大,遂弃)


然后我们可以直接计算证明,麦克斯韦方程组的第一个和第四个方程等价于:

\partial_\mu F^{\nu\mu}=J^\nu

J^\mu=(\rho,J_x,J_y,J_z),叫做电流四矢量)

第二个和第三个方程等价于:

\partial_\mu F_{\nu\rho}+\partial_\nu F_{\rho\mu}+\partial_\rho F_{\mu\nu}=0

而这两个关于F_{\mu\nu}的方程都是洛伦兹协变的。

也就是说,经典麦克斯韦方程组自动满足相对论的洛伦兹协变性!

并且一件更好玩的事情是,既然F_{\mu\nu}的两个方程都是洛伦兹协变的,那我就做做洛伦兹变换看看能得到什么?

我们令

x_{\mu}' = a_{\mu\nu}x_{\nu}

a_{\mu\nu}是洛伦兹变换的变换矩阵。

那么F_{\mu\nu}作为协变二阶张量的变换关系为

F_{\mu\nu}'=a_{\mu\tau }a_{\nu\kappa }F_{\tau\kappa }

带入

\partial_\mu F^{\nu\mu}=J^\nu
\partial_\mu F_{\nu\rho}+\partial_\nu F_{\rho\mu}+\partial_\rho F_{\mu\nu}=0

(一大波我写了你肯定也不会看的计算= =#)

得到

E'_{//} = E_{//}, B'_{//} = B_{//} (平行于运动方向的电场和磁场。)

E'_{\bot } = \frac{(E + v\times B)_{\bot }}{\sqrt{1-\frac{v^2}{c^2}}},B'_{\bot } = \frac{(B - \frac{v}{c^2}\times E)_{\bot }}{\sqrt{1-\frac{v^2}{c^2}}} ( 垂直于运动方向的电场和磁场。)


我要说的是,垂直方向的结果实在是太有意思了!

因为当速度趋于零的时候,它就是那个不做功的洛伦兹力呀!


至此,电磁现象的所有(非量子)问题,完全解决!



====================================================================

这样,狭义相对论的整体框架基本上就写完了。更高层次的东西,那就上手微分几何直接杀向广义相对论吧。

狭义相对论是一个干净,优雅,精确的理论。很少有人工雕琢的痕迹。所以一直想写它。这篇文章是久违的一篇长文,很满足。

很多物理学家说过,“相对论”是相对论最糟糕的名字。因为事实上它是一个非常绝对的理论。这个理论里面的一切都是静止的。都是在时空这个几何上不变的事物。一切都精细地安排好了。没有随机,没有不确定。原则上也没有不确定的未来。不知道我有没有写出这样的感觉。



不过话说回来,真实世界难道真的是机械的,绝对的么?未来真的是完全确定的么?

嗯哼,我们的下一场live:量子力学的基本原理

要来打脸了( ̄ε(# ̄)☆╰╮( ̄▽ ̄///)

编辑于 2016-11-09

文章被以下专栏收录