均匀设计篇之七:华罗庚先生与优选法

本单元介绍了中国人在应用统计方面的贡献,还有一个人不能不提,那就是大数学家华罗庚先生,本文简单介绍一下他提出并亲自推广的两法(统筹法和优选法)之一的优选法。

  说起华罗庚,估计是无人不知,无人不晓,但他自上世纪六十年代所创立的优选法估计知道的人不一定很多。

时间追溯到1958年,在当时数学界掀起了理论联系实际和数学直接为国民经济服务之风,华先生率领一大批数学家走出校门到工农业生产单位去寻求线性规划的实际应用案例,取得了一批应用与理论成果。

由于线性规划和其它一些方法要求繁杂的计算(当时还没有计算器),应用面也不广,难以进行大规模的推广,线性规划运动也逐渐冷了下来。华先生总结经验,不断思考,要寻求一些易于被人接受、应用面广的数学方法。60年代,他从国外友人那里得到了关于CPM和PERT(这是项目管理的重要工具)的资料,这些方法虽然简单,但对制定生产管理和作业计划很有帮助。华先生和他的助手们透彻地分析并简化了这些方法,起名叫统筹法。

在提出统筹法的同时,华先生又考虑生产工艺的(局部)层面,如何选取工艺参数和工艺过程,以提高产品质量。为此他提出了优选法,即选取这种最优点的方法本身也应该是最优的,或者说可用最少的试验次数来找出最优点。他从理论上给出了严格的证明。1971年7月出版了小册子《优选法平话》,后来又扩充了一些案例编写了《优选法平话及其补充》。这本书用通俗的语言和生活中的案例来讲解优选法,普通工人都能学得会,用得上,从而得到了广泛的应用。

我上世纪七十年代就知道优选法了,算起来应该是优选法开始推广没有多少年(是的,我是一个快退休的老人啦)。在我家北边约100米外有一个大戏院,驻有一个梆剧团,时常演一些梆子戏、豫剧啥的,当然主要是样板戏,那时候我看过《智取威虎山》、《红灯记》、《杜鹃山》、《艳阳天》等等,至今还有印象。大戏院门口有一个很小的广场,青砖铺地,有时也会放放露天电影,都是一些纪录片、科教片,《优选法》就是那时候放的。从这部片子里,我第一次知道了华罗庚,知道了黄金分割。片子里有个案例是怎样快速查找输电线路的故障点,用的就是0.618法,我当时很好奇,片子里的动画是怎么做出来的。我一直在寻找这部科教片,可惜到现在也没找到。

在华先生的小册子里,按照当时的惯例要先把领袖的语录贴上。在第二页有这样几句话,现在看来跟六西格玛的思想还是满契合的。

在小册子里,介绍了不少方法,核心的方法当然还是0.618法。

0.618有很好的性质,如1:0.618=1.618:1,(1-0.618)/0.618=0.618等等。对于优选法来说,1-0.618=0.382和0.618是两个非常重要的点。这两个点距离0~1的中间点0.5距离相同,或者说以0.5为轴互为镜像。华先生运用这一特征生动地运用折纸法来解释这一方法的应用。下面分单因子和两因子两种情况简单介绍一下。

单因子优选法

一. 0.618法或折纸法

0.618法通常适用于不预先限定试验次数的,单峰的函数,如这样的:

为方便说明,我们假设一个因子,其取值范围为1000~2000。可以制作一张纸条,在两端分别标上1000和2000。取纸条的0.618长度,即因子设定1618,做第一次试验,如下图

把纸条对折过来,得到第一个试验点的镜像点0.382,即因子设定1382,做第二次试验。

比较两次试验,如果(1)好于(2),则将(2)左边的纸条剪掉,反之剪掉(1)右边的纸条,剩下的长度就是原长的0.618。假设(2)比(1)好,剪掉(1)右边的纸条后再将剩下的纸条对折,找到第三个试验点,即1236。

  比较两次试验,如果(2)好于(3),则剪掉(3)左边的纸条,留下0.618的长度,然后再对折,找到下一个试验点,直至找到最佳点。

  这样的方法需要的试验次数不多,5次试验就可以将范围缩小到原来的0.618^5=0.09,6次可以将范围缩小到原来的0.618^6=0.056,可见试验收敛得很快。我认为这比我们所学的OFAT(One Factor Alternatively Test)的效率要高很多。

二. 分数法

当因子是离散的,或试验次数事先限定了,0.618法就不太适应了,这时候我们就要用到著名的斐波那契数列。这个数列大多数人初中的时候就学过了,当然像我这样在文革期间上学的人显然没有学过。

假设试验范围确定,且试验次数n确定,首先要找到数列的n+2项Fn+2,把试验范围分成Fn+2项,再找到第n+1项Fn+1,该值即为第一个试验点。以后试验点的取法均按类似于0.618法依次进行,直到n次试验全部做完,比较各试验结果即可得到最佳方案。

例:某化学反应的温度为120~200度,要求只进行4次试验,找出最好的试验结果。

解:Fn+2=8,Fn+1=5,第一个试验点在5/8处,即170度。

第二个试验点与0.618法类似,用镜像点,即150度。

比较两个点的结果,如果(2)好于(1),则舍弃170度以上部分。剩下的部分再找到镜像点,即140度,为第三个试验点。

比较试验结果,如果仍是(2)好,则舍弃140度以下部分,在寻找第四个镜像点,得到160度。如果仍是(2) 好,则最终确定150度为最佳反应温度。

其它方法就不再做介绍,感兴趣者可以查找相关资料。

两因子优选法

如果单因子用纸条来折,两因子就要用一张正方形的纸来折。首先在纵(或横)向的0.618处折出一条线,在这条线上用0.618法找出最佳点。然后以这个点为准,横(纵)向折一条线,再在这条线上找出最佳点。以此方法轮换两个因子进行试验,直至找到最佳点。下图中画了5次折纸(请忽略我画图的手艺),有可能实际的折纸次数比这多,也可能少。这样折的话试验次数还是比较多,在每一条折出的直线上可能都要做若干次(最多5~6次吧),如果折纸次数多的话,试验次数就显得过多了,与正交设计相比显然不太经济。

优选法就择其典型的方法介绍到这里。

在我看来,优选法对于单因子的试验来说效率是比较高的,但多因子的情况就不见得有效率,反而正交设计和均匀设计的效率更高,也更准确,毕竟这些设计能够同时考虑交互作用。

随着统计软件的普及,单因子的优选法也被一元回归所替代,如果采用5~6次试验,用一元回归来拟合曲线也是一个非常好的寻找最优点的方法。我估计这也是当前优选法较少有人提及的原因。但无论如何,我们的前辈们给我们提供了多种解决问题的方式,使我们有更多的解决问题的办法,这本身就是一件很有意义的事情。

华先生用非常通俗的语言把复杂的方法简单化,使得广大一线职工很容易掌握和运用,这种精神很值得我们敬佩。反观我们从事六西格玛工作的人,反而将六西格玛弄得高大上了,变成了少数人显摆的玩意。别忘了很多黑带们引以为傲的试验设计,其实在上世纪六、七十年代就已经很普及了。为了让正交设计通俗易懂,数学家们为此想了很多办法,表格化就是其中之一。如果留心一下,就能找到这篇登在《数学实践与认识》1975年02期上的文章《老大娘学“正交”,“三废”变三宝》,可见当时推广的深度。所以,我们这些黑带们要好好反思了。

请关注我的微信公众号:张老师漫谈六西格玛

编辑于 2017-01-17

文章被以下专栏收录