A DIKTE
首发于A DIKTE
Gauss与AGM(IV-2)

Gauss与AGM(IV-2)

[注:题图是Gauss 1798年4月21日致Bolyai的信,与正文有一点点的关系。里面有Gauss画的小地图和Gauss的签名,所以就把它用作题图了。]

Gauss在致Schumacher的信中提到自己在14岁时就开始研究算术-几何平均(AGM),那么,有什么其他证据证明Gauss在14岁时就开始这项研究了呢?答案是没有。Gauss全集公布的日期明确的记录当中,没有Gauss 1797年之前关于AGM研究的内容。第一条时间非常明确的记录来自1798年11月的Scheda Ab , 这一段记录正好与Scheda Aa 的写作时间(1798年7月开始)衔接。

Scheda Ab 中给出了 M(1+x,1) 的幂级数展开式[见Gauss全集第十卷第一册,172页,174页]:

M(1+x,1)=1+\frac{1}{2}x-\frac{1}{16}x^2+\frac{1}{32}x^3-\frac{21}{1024}x^4+\frac{31}{2048}x^5-\cdots

这一级数展开来自 M(a,b) 的初等性质 M(a,b)=M((a+b)/2,\sqrt{ab}) 以及 M(\lambda a,\lambda b)=\lambda M(a,b),\lambda>0 。如果

M(1+x,1)=\sum a_nx^n,a_0=1

x=2t+t^2

那么我们有

\sum a_n(2t+t^2)^n=(1+t)\sum a_n(\frac{t^2}{2(1+t)})^n

两边级数展开,一项一项对比系数就可以得到上面的结果。


这个级数并不是计算 M(1+x,1) 的理想选择,因为从展开式可以看到,它的收敛速度是很慢的。Gauss在Scheda Ab 中计算了 M(\sqrt{2},1)-1 ,只得到 0.19814 [见Gauss全集第十卷第一册,174页]。得到这样的精度至少得用幂级数的前六项或七项,所以进行这样的数值计算并不是很划算。话说回来,为什么Gauss要计算 M(\sqrt{2},1) 呢?这并不能完全归结为Gauss的所谓“直觉”,有可能来自AGM数列的另外一个初等性质。我们知道,AGM迭代过程可以归结为

a^\prime=(a+b)/2,b^\prime=\sqrt{ab}

将这个过程逆转过来,我们就有

a=a^\prime+\sqrt{{a^\prime}^2-{b^\prime}^2},b=a^\prime-\sqrt{{a^\prime}^2-{b^\prime}^2}

前者可称为正向AGM迭代,后者称为反向AGM迭代。下面的数值计算[摘自Gauss全集第三卷,363页]

AGM的数值计算结果

表明,反向迭代中a似乎趋于无穷,而b趋于0,而且,每一次迭代似乎使a的值近似变为原来的2倍。我们采用Gauss的记号,如果设 (^0a=a,\,^0b=b)

\begin{align}^{n+1} a=\, ^{n}a+\sqrt{(\, ^{n}a)^2-(\, ^{n}b)^2}\\^{n+1} b=\, ^{n}a-\sqrt{(\, ^{n}a)^2-(\, ^{n}b)^2}\end{align}

那么我们有

\frac{^{n+1} a}{2^{n+1}}=\frac{1}{2}\left(\frac{^{n}a}{2^n}+\sqrt{(\frac{^{n}a}{2^n})^2-(\frac{^{n}b}{2^n})^2}\right)

这只是半个正向AGM的迭代过程。我们很容易找到它的另一半:

(^{n+1}a)^2-(^{n+1}b)^2=4\times\, ^{n}a\sqrt{(\, ^{n}a)^2-(\, ^{n}b)^2}

所以 \lim_{n\rightarrow\infty}\frac{^{n}a}{2^n}=M(a,\sqrt{a^2-b^2}) 。正向迭代引出极限 M(a,b) ,反向迭代引出 M(a,\sqrt{a^2-b^2}) 。当 a=1,b=\sqrt{2}/2 ,两个极限是相等的。那么计算这个特殊极限 M(1,\sqrt{2}/2) 或其倍数 M(\sqrt{2},1) 就显得顺理成章。

[注:逆向AGM过程已经出现在Leiste算术书第56页的记录中。]


1798年的下半年和1799年的上半年Gauss很可能没有花太多时间在AGM上,因为还有很多其他的事情等着他去做。Gauss已经在1798年9月结束哥廷根的学生生涯,返回家乡不伦瑞克。《算术研究》于1798年4月在哥廷根东北方向的Goslar开始印刷,但印刷速度极其缓慢,令他很不满意。在11月29日与终生好友Farkas Bolyai通信中,他提到自己正在第四次修订《算术研究》关于二次型的一章,同时,他也在抓紧创作《算术研究》关于高次同余式的第八章,预计可以在1799年复活节前完成第八章的写作(Gauss日记中1798年11月到1799年3月也确实只有一条记录,还是关于二次型的记录)。1799年4月Gauss的注意力又转移到月球视差上,在4月-5月期间他还在不伦瑞克公爵的要求之下向Helmstedt大学提交了博士论文。这些事情完成后,Gauss与Bolyai两人相约在哥廷根与不伦瑞克之间的Clausthal见面。两人在5月24日见面,5月25日含泪道别。两人都是步行前来,从各自的住处来到会面地点每人都得走10小时以上(值得Gauss这样做的朋友在此之后大概是没有了)。根据两人5月28日5月29日的通信,两人在回程的路上都碰到了大雨,Gauss似乎还吃坏了肚子,在5月29日写信的时候还感到不适。就在这样的情况之下,Gauss日记上出现了一条新的记录(1799年5月30日):

Terminum medium arithmetico-geometricum inter 1 et \sqrt{2} esse =\frac{\pi}{\varpi} usque ad figuram undecimam comprobavimus, qua re demonstrata prorsus novus campus in analysi certo aperietur.

我们已经证实 1\sqrt{2} 算术几何平均与 \frac{\pi}{\varpi} 相等到小数点后11位,证明此问题必然会开启分析学的新领域。

我们在前面提到的幂级数展开在这里派不上用场——因为它收敛太慢了。可以证明,计算 M(\sqrt{2},1) 只需要迭代四次就可以精确到小数点后11位(为什么?),所以还是老老实实迭代比较划算。Gauss在Scheda Ab 中已经已经给出了 \sqrt{2} 以及 \sqrt[4]{2} 的数值(精确到小数点后13位),所以我们就可以列出下面的表格[计算方法不限幂级数,对数表以及Newton迭代, 结果取小数点后12位有效数字]

\begin{array}{c|c|c} & a_n & b_n\\0& 1.414213562373 & 1.000000000000\\1 & 1.207106781187 & 1.189207115003\\2& 1.198156948095&1.198123521493\\3 & 1.198140234794& 1.198140234677\\4&1.198140234736&1.198140234736\end{array}

经过4次迭代后 a_4,b_4 差的绝对值已经小于 10^{-12} (其实已经小于 10^{-18} )。我们如果回头去看我们在预篇中Stirling的计算以及Euler的推理,我们就知道,如果 \varpi=2\int_{0}^1\frac{\mathrm{d}x}{\sqrt{1-x^4}} , 那么 \frac{\pi}{\varpi}=2\int_{0}^1\frac{x^2\mathrm{d}x}{\sqrt{1-x^4}}\approx1.198140234736

[注:Gauss早在1797年就在Leiste笔记上记录了 2\int_{0}^1\frac{x^2\mathrm{d}x}{\sqrt{1-x^4}} 的数值[见Gauss全集第十卷第一册,146页],在1798年7月更是不知道接触过多少次 \frac{\pi}{\varpi} 及其倒数,见Gauss与AGM(III-1)Gauss与AGM(III-2)Gauss与AGM(III-3)]

双纽线积分就这样与AGM产生了联系。我们自然而然地就会产生疑问:这是一个孤立的现象呢,还是一个一般的现象呢?几个月以后(11月24日)Pfaff在致Gauss的信中这样说[可见Gauss之前已经和Pfaff说过自己5月30日的发现了,他对自己的发现并不是对谁都守口如瓶的]:

...Sehr interessant war mir die besondere Bemerkung, welche Sie uber das arithm. geom. Mittel zwischen 1 und \sqrt{2} gemacht haben, wobey die Übereinstimmung gewiss nicht zufällig und isolirt ist, sondern noch mehr in sich schliessen wird. ...

……我对你在来信中着重指出的 1\sqrt{2} 之间的算术几何平均值十分感兴趣,它与[积分]的吻合必然不是巧合,也不是孤立的,它们之间的关系应当更紧密。……

Pfaff本人在来信里也做了一些计算,但他所做的计算并没有超出Gauss Scheda Ab 所涵盖的内容。至于Pfaff的断言"它与[积分]的吻合必然不是巧合,也不是孤立的",Gauss必然也察觉到了这一点。我们知道,Gauss在1798年7月前后曾经数值计算过 \frac{\varpi}{\pi} ,其中含 \sqrt{2} 的唯一一个是

\begin{align}\frac{\varpi}{\pi}&=\frac{\sqrt 2}{\pi}\int_{0}^{\pi/2}\frac{\mathrm{d}\theta}{\sqrt{1-\frac{1}{2}\sin^2{\theta}}}=\frac{\sqrt 2}{2}F(1/2)\end{align}

其中 F(x)=1+\frac{1}{4}x+\frac{1}{4}\frac{9}{16}x^2+\frac{1}{4}\frac{9}{16}\frac{25}{36}x^3+\cdots ,那么,我们就有 F(1/2)=\frac{\sqrt{2}}{M(\sqrt{2},1)}=\frac{1}{M(1,\sqrt{2}/2)} 。结合 F(0)=M(1,1)=1 以及 F(1)=\infty,M(1,0)=0 ,我们可以猜测,研究 M(1,x) 的倒数才是解决问题的关键,具体地说,我们有猜想 F(x^2)=\frac{1}{M(1,\sqrt{1-x^2})},-1< x< 1

[注:前面我们已经提过,1799年4月Gauss在研究月球的视差问题。这一阶段研究月球视差公式的手稿中突然出现了加密的文字 \mathrm{REV.\,GALEN}\mathrm{GALEN} 也出现在1799年11月研究椭圆函数的手稿当中[[见Gauss全集第十卷第一册,187页,539页]。据Kurt Biermann 1963年的推断,这段文字可能指的就是研究AGM的倒数才是进一步研究的关键。(Biermann 推断: \mathrm{GALEN} 的全称可能是Nexum Egregium curvae Lemniscatae cum medio Arithmetico-Geometrico)]


我们今天知道,Gauss对这个等式有三个证明。其一来自形式幂级数的操作(这说不定是最早的证明,缺陷在于事先需要证明 M(1,\sqrt{1-x^2}) 存在幂级数展开),其二来自积分的变量代换(毫无疑问是最晚的证明),而第三个证明利用的是 F(x^2) 所满足的微分方程。我们现在就给出这个证明[见Gauss全集第十卷第一册,181-183页。这一证明属于编号为Ff的Gauss文档]。

问题:证明 F(x^2)=\frac{1}{M(1,\sqrt{1-x^2})},-1< x< 1

证明:形式幂级数方法利用了函数方程 M(1,\sqrt{1-x^2})=M(1+x,1-x) ,令 x=\frac{2t}{1+t^2} ,我们就有

M(1+x,1-x)=\frac{1}{1+t^2}M(1+t^2,1-t^2)

借此通过对比等式两边的幂级数的系数来证明结论。这一性质暗示, F(x^2) 满足变换 F\left(\left(\frac{2t}{1+t^2}\right)^2\right)=(1+t^2)F(t^4)

此时如果令 G(x)=M(1+x,1-x)F(x^2) ,那么 G\left(\frac{2t}{1+t^2}\right)=G(t^2),-1<t<1

函数方程决定:如果 G(t)t=0 处连续,那么 G(t) 只能是常数[为什么?]。可以证明 G(t)t=0 处连续[为什么?],那么命题就得到了证明。


证明变换的关键在于证明 F\left(\left(\frac{2t}{1+t^2}\right)^2\right)(1+t^2)F(t^4) 满足同一个二阶常微分方程。如果我们令

f(x)=\sum_{n=0}^{\infty}\left(\frac{1\cdot3\cdot5\cdots\cdot(2n-1)}{2\cdot4\cdot6\cdots\cdot(2n)}\right)^2x^{2n}=\sum_{n=0}^{\infty}a_{n}x^{2n}

待证明的等式即为

\frac{2t}{1+t^2}f\left(\frac{2t}{1+t^2}\right)=2tf(t^2)

根据系数的递推关系

(2n)^2a_n=(2n-1)^2a_{n-1} ,我们可以建立 f 的微分方程(为什么?)

x(x^2-1)\frac{\mathrm{d}^2f}{\mathrm{d}x^2}+(3x^2-1)\frac{\mathrm{d}f}{\mathrm{d}x}+xf=0


根据复合函数求导的法则,我们知道

\begin{align}\frac{\mathrm{d}f}{\mathrm{d}x}&=\frac{\mathrm{d}f}{\mathrm{d}y}\frac{\mathrm{d}y}{\mathrm{d}x}\\\frac{\mathrm{d}^2f}{\mathrm{d}x^2}&=\frac{\mathrm{d}f}{\mathrm{d}y}\frac{\mathrm{d}^2y}{\mathrm{d}x^2}+\left(\frac{\mathrm{d}y}{\mathrm{d}x}\right)^2\frac{\mathrm{d}^2f}{\mathrm{d}y^2}\end{align}

借此可建立 \frac{2t}{1+t^2}f\left(\frac{2t}{1+t^2}\right)2tf(t^2) 满足的微分方程。通过计算,它们满足同一个二阶常微分方程(请有兴趣的读者来验证)

t^2(t^4+1)\frac{\mathrm{d}^2f}{\mathrm{d}t^2}+(3t^4-1)t\frac{\mathrm{d}f}{\mathrm{d}t}+(t^4+1)f=0

且两者在 t=0 处的零阶和一阶导数相等,这样我们就证明了结论。

这个过程有一个副产品。我们通过上面的推理,得出 \frac{1}{M(1,\sqrt{1-x^2})} 满足微分方程

x(x^2-1)\frac{\mathrm{d}^2f}{\mathrm{d}x^2}+(3x^2-1)\frac{\mathrm{d}f}{\mathrm{d}x}+xf=0 。那么与之相伴的 \frac{1}{M(1,x)} 呢?利用与上面类似的计算,我们得到, \frac{1}{M(1,x)} 也是这个微分方程的解,而且两者构成微分方程解空间的一组基。这样 M(1,x),M(1,\sqrt{1-x^2}) 之间就有了更加密切的联系。

[注:我们可以使用Wronsky行列式来确定两个解是否线性无关。根据二阶线性微分方程的理论,我们可以得到上面微分方程的Wronsky行列式为 C/(x^3-x) 。我们会在下一篇中确定常数 C 的值。]


到1799年年底,Gauss手中已经拿到了一般[不限于双纽线积分]椭圆积分理论的几片拼图:

  • AGM;
  • 微分方程;

如果我们回过头去看1798年Gauss的工作记录 Scheda Aa(在那里出现了 \sqrt{\frac{\varpi}{\pi}} ),我们就应当加入第三片拼图:

  • theta函数。

只有这些拼图全都到手才能开启下一阶段,也就是Gauss 1799年11月Scheda Ac 的研究。在进入Scheda Ac 之前,我们会在下一篇来解决Schumacher的问题,这与Gauss的后续研究有着极为密切的关系。

编辑于 2018-10-20

文章被以下专栏收录