从哥德巴赫猜想说起

从哥德巴赫猜想说起

最近一阵,哥德巴赫猜想突然在知乎上非常热门。我发现有很多人有如下的观点:哥德巴赫猜想并不自然,因为素数是用来乘的不是用来加的;哥德巴赫猜想不重要,没有一流数学家关心;以及哥德巴赫猜想与数学的其他分支没有关联,是个孤立的问题。这里我从加性数论的角度,分析一下为什么哥德巴赫猜想重要并且自然。

首先我们看看哥德巴赫猜想具体是什么。(在本文中,用素数来表示大于 1 ,并且只被 1 和它本身整除的整数。这里强调一下,以免混入“负质数”。。)

哥德巴赫猜想:
任何大于等于4的偶数可以表示成两个素数的和。

为了更好的理解它,我们先定义加性数论中的Minkovski和:对于两个集合 A,B ,我们定义

A+B=\{a+b\mid a\in A, b\in B\}.

在这个定义下,当 A=B 时我们记为 2A=\{a+b\mid a,b\in A\}.

例. 如果 A=\{1,2,3\} ,那么 2A=\{2,3,4,5,6\}.

如果我们记 \mathbb{N}_{>1} 为所有大于等于 2 的自然数, \mathbb{P} 为全体素数,我们可以用上面的定义重新描述哥德巴赫猜想。

哥德巴赫猜想:
2\mathbb{P}\supseteq2\times\mathbb{N}_{>1}.

其中记号 2\times A=\{2a\mid a\in A\} 。更一般的,可以定义 A\times B=\{a\times b\mid a\in A, b\in B\} ,不过本文暂不涉及这个一般的定义。

乍一看,这个猜想确实不太靠谱:素数这么稀疏,怎么可能加起来就能覆盖所有的偶数?另外,可能也有人会问,为什么要研究两个素数集的和?有什么意义?

首先,研究两个集合的Minkovski和,起始于对费马大定理的研究。首先我们定义一个集合 A 叫做无和集(sum-free set)(A+A)\cap A=\varnothing 。 也就是说,不存在 A 中的两个元素 x,y使得 x+y 也是 A 中的元素。

例. \{1,3,5,9\} 是无和集,但是 \{2,5,7,8\} 不是,因为 2+5=7

我们定义 \mathbb{N}^k 是自然数的 k 次幂构成的集合,即 \mathbb{N}^k=\{n^k\mid n\in\mathbb{N}\} 。那费马大定理就等价于: \mathbb{N}^k 对于 k\geq3 是无和集。从这个观点看,研究无和集的结构是一个很重要的问题。实际上关于无和集的突破进展也大都集中在近些年。我们先考虑下面这个问题:

请快速从 \{1,2,\dots,n\} 里面说出一个尽可能大的无和子集。

我们的第一反应是什么?好吧,可能有两种不同的第一反应。一个是从“奇数加奇数是偶数”的角度,敏锐的发现所有奇数组成的集合是无和集(因为没有偶数在其中);另一个角度是选取一个大的区间,比如在 n是偶数的情况下,由于 \frac{n}{2}+\frac{n}{2}=n ,可以发现 \{\frac{n}{2}+1,\frac{n}{2}+2,\dots,n\} 是无和集(因为最小的数和最小的数相加已经大于 n )。

可以证明以上两种无和集的选取都是最大的。最近,Balogh et. al 应用容纳集引理(container lemma)数出了最大的无和集的个数,从而我们可以说出,随机的取一个子集,它是最大的无和集的概率。那么,无和集长什么样子呢?这个显然也是我们非常关心的问题,因为我们了解 \mathbb{N}^k 的样子,如果我们再知道了无和集的样子,通过对比,我们就能从这个角度证明费马大定理。然而遗憾的是,我们现在只知道相对大的无和集的结构:粗略的说,一个 \{1,\dots,n\} 的无和子集,如果他有至少 2n/5 个元素,那么他要么是一个区间,要么都是奇数。2018年Tran的最新结果,也只是把 2n/5 缩小到了 (\frac{2}{5}-\delta)n 。可惜, \mathbb{N}^k 都是非常稀疏的集合;对于稀疏无和集,我们还不知道它的结构。

除了无和集之外,另外一个备受关注的问题是,对于任意集合 AA+A 到底有多大。Freiman首先证明了,如果 An 个元素,那么 A+A 至少有 2n-1 个元素;并且 A+A 的元素个数取到最小值,当且仅当 A 是一个等差数列。

Freiman之后又证明了,如果 A+A 中的元素个数很少,即 |A+A|<Cn 其中 C 是某个和 n 无关的常数,那么 A 的结构差不多是一个高维等差数列。对于高维等差数列,粗略的说,可以理解为一个首项,不同公差的一堆等差数列混到了一起。

Freiman类型的结果很快成为加性数论的核心问题,很快吸引了包括陶哲轩在内的很多一流数学家的兴趣。对于任意有限群,一个子集 A 叫做 K\text{-}approximate\ group 如果 A+A 可以被 KA 的左陪集覆盖。陶哲轩,Ben Green和Breuillard最近的结果,证明了对任意集合 A ,如果 AK -approximate的,那么粗略的说, A+A+A+A 几乎是阿贝尔的。这个结果也加强了Gromov著名的对多项式增长的群的结果。如果 A 所在的群本身就是阿贝尔的,那么我们有更强的结果,把 A 的span的大小和 A+A 紧密联系起来。由于本文是科普的目的,关于这些问题的细节不再多讲了,有空我会在专栏 Some Interesting Combinatorial Problems 里面专门写一篇文章介绍一下。

最后我们回到哥德巴赫猜想。刚才的结果说明,如果 A 有良好的结构,那么 A+A 可以很小,小到和 A 差不多大。那么,有两个问题我们很自然的会问: A+A 至多可以多大?素数有没有所谓“良好的结构”?

关于第一个问题比较容易回答:假设 An 个元素,我们取 A 为等比数列,可以很容易发现, A+A 这个时候几乎有 n^2/2 这么多个,这个是 |A|^2 的量级,可以说是非常多了。

那素数有没有良好的结构呢?这个问题就很难了。素数定理告诉我们,小于 n 的素数大约有 n/\ln n 这么多,要比 \sqrt n 多很多。那素数是如何分布的呢?这方面有很多著名的猜想,比如黎曼猜想,都没有解决。不过我们可以从已经证明的定理,以及看上去很像是正确的著名猜想来推测一下素数如何分布。孪生素数猜想,以及关于素数的最大间隔的Cramér猜想,都是以“素数为随机分布的数”建立的模型推测而来。另外,Green-Tao定理,素数包含任意长的等差数列定理,其中关键步骤是应用Goldston et. al的结果,将素数嵌入了一个稀疏的伪随机图。这也暗示着素数,有着像随机数一样的分布。

那如果 A 是随机数构成的集合, A+A 有多大呢?可以用概率方法证明,这时 A+A 基本取到了所能取到的最大值。这也说明,如果我们对素数分布的猜测正确,哥德巴赫猜想很可能是正确的。同时,我们也能看到哥德巴赫猜想和素数分布,以及代数,几何,分析和组合之间的关联。

编辑于 2019-01-31

文章被以下专栏收录

    专栏面向本科生,非组合方向的研究生以及数学爱好者。专栏中用英文标题的文章,多为涉及当前科研问题的科普,面向有一定数学基础的读者;中文标题的文章更通俗可读,面向所有对数学有兴趣的人。