控制理论:寻找普适方法之路

控制理论:寻找普适方法之路

控制理论:寻找普适方法之路

在各种生产过程中,人们始终在努力寻找一种普适方法,使得机器和设备的某个工作状态或参数在无人直接参与的情况下,自动地按照预定的规律运行,这就是自动控制

自动控制的历史是与人类工业化的历史紧密联系的。历史上第一个有据可查的自动控制系统,是1788年瓦特在改进蒸汽机时发明的离心式调速器。当负载或蒸汽供给量发生变化时,离心式调速器能够根据这一变化自动地调节进汽阀门的开度,从而控制蒸汽机的转速。这一系统虽然简单,却完整地体现了控制理论的主题——反馈。

离心式调速器

反馈,是指取出输出量送回到输入端,并与输入信号相比较产生偏差信号的过程,若反馈的信号是与输入信号相减,使产生的偏差递减,则称为负反馈。(负)反馈概念的精髓是利用误差来自动地减少误差。这样形成的因果链是输入、动态系统、输出、测量、比较、误差、输入构成的一个闭合环路,以此实现对系统的自动控制,因而反馈控制也叫闭环控制。

一个简单的负反馈系统

控制理论的另一个主题是优化。所谓优化,在数学上可以归结为在有约束条件或无约束条件下求目标函数极值(最值)的问题。在控制理论中,目标函数J刻画的是所需性能和系统实际性能间的差异的性能指标,J的自变量仍然是一个函数f(t),这样的J称为泛函。我们要求一个f(t)使J最小化,这个f(t)形成了整个控制时段中一个预先规划好的输入控制,这就是最优控制的主要内容,即轨迹最优化问题。

反馈和优化在控制领域中复杂地交织在一起,控制理论将反馈作为优化的手段,其基本原因是要在不确定性存在的条件下达到性能目标。尽管对于不同系统,人们所期望的性能目标不尽相同,但是,对于任何一个自动控制系统,以下三个要求都是必须考虑的。

第一,稳定性是保证系统正常工作的先决条件。一个稳定的控制系统,理论上其被控量偏离期望值的偏差应当随时间的增长最终趋近于零,也就是被控量达到的稳态值与期望值一致。

第二,实际情况下,由于系统不断承受外界的干扰,而输出的观测常受到噪声的污染,被控量的稳态值与期望值之间会有误差存在,这就是稳态误差。一个理想的控制系统应当使稳态误差尽可能小,即控制系统的准确性要求。

第三,除了对系统的稳态提出要求外,还必须对其从初始态到稳态的过渡过程提出要求。衡量系统过渡过程优劣的一系列指标称为动态性能指标,其中最重要的对过渡过程时间的度量。我们希望尽量缩短过渡过程的时间,这就是对控制系统快速性的要求。

1868年,麦克斯韦首先通过对调速器反馈系统进行数学建模来研究其稳定性,这是建立数学的自动控制理论的开始。1892年,李雅普诺夫在其博士论文《论运动稳定性的一般问题》中,进一步提出了分析系统稳定性的一般方法,即李雅普诺夫稳定性分析理论。1922年,米诺斯基在对船舶驾驶控制的研究中,率先提出了PID控制方法。

u(t)=k_pe(t)+k_i\int_0^{t_f}e(t)\mathrm{d}t+k_d\frac{\mathrm{d}e(t)}{\mathrm{d}t}

PID控制规律u(t)是比例、积分、微分这三种控制方法的叠加。PID中的比例调节规律,依据当前存在的偏差产生调节作用;积分依据偏差的持续累积,用于消除那种变化缓慢,幅度较小但持续存在的偏差;微分控制对速度敏感,依据未来的偏差,有预见的进行调节。PID控制消除偏差,是综合考虑了现在(P),过去(I)和未来(D)的结果。

PID控制原理简单,使用方便,对模型的适应性强,受到控制对象非线性和时变性的影响相对较小,其控制品质对被控对象特性的变化敏感程度较低。因此直至今日,PID控制仍然是最常用的控制方式,在工业生产过程中,PID控制算法占到85%到90%的比重。一个大型的现代化生产装置的控制回路可能多达一二百种甚至更多,其中绝大部分都采用PID控制。只有被控对象特别难以控制,控制要求特别高的情况下,如果PID控制难以达到生产要求,才考虑采用更先进的控制方法。

20世纪30年代,把由微分方程刻画的连续时间动态系统通过拉普拉斯变换表示为传递函数,并进而分析其稳定性、准确性和快速性的方法基本成熟。在此基础上,奈奎斯特和波特等人通过研究传递函数在频域上的性质,提出了对控制系统进行设计和校正的一般方法。对单回路反馈系统的研究结果同时表明,反馈控制即使在系统情况知之不多的条件下,也可以得到较好的性能。

许多情况下,对于系统的了解是不全面的,或者可用的模型充满简化的假设,以至于不再确切,此时为之建立一个合适的数学模型是特别困难的。即使我们可以写出一个系统的精确的动力学方程,它也可能十分复杂,以至于无法在其基础上设计一套控制规律。有效的反馈可以减少所有这些不确定性的影响,补偿由于任何原因引起的误差,从而为利用十分简化的模型来刻画复杂的系统铺平了道路。

这样,问题的关键就是寻找一个鲁棒的经验的模型,在有效数据基础上,可以用系统辨识的办法来求得。所谓鲁棒性是指系统在受到干扰时维持原有特性的能力。所谓系统辨识,是指用在一个动态系统上观察到的输入与输出数据来确定它的模型的过程。如果模型结构已经给定,只是其参数尚未知晓,则系统辨识就变成参数估计,即寻找参数使得模型与实际数据的偏差最小化,这是一个典型的优化问题。

第二次世界大战中,美国集中了大量来自世界各地的顶尖学者,加之原子弹研制过程中产生的许多前所未有的复杂问题,推动了相关理论的一次大踏步的前进。

在控制领域,1942年,齐格勒和尼科尔斯提出了整定PID控制器参数的齐格勒-尼科尔斯方法,进一步夯实了PID控制的应用基础。维纳于1947年提出的控制论与贝塔朗菲于1945年提出的系统论,和香农于1948年提出的信息论并称为“三论”。

系统论对系统整体性的洞察,启发了控制领域学者对于复杂系统的研究。而信息论借鉴了物理学中“熵”的概念来刻画信息,并研究如何从被噪声污染的观察信号中重构原信息的问题。控制论则提供了一个把控制问题和通信问题统一考虑的框架,维纳利用随机过程理论,发展了在有噪声的情况下信号的滤波、预报和平滑的方法。另一方面,基于信息的反馈也为控制理论提供了新的视角。

在优化领域,以1947年丹齐格提出解决线性规划问题的单纯形法为开端,运筹学理论与强调不等式约束的线性和非线性规划理论也得到了长足发展。1951年,贝尔曼以最优统计决策和资源分配中的序贯规划问题的研究为基础,提出了完整的动态规划理论。这些理论在控制领域的主要贡献是,通过考虑初始状态参数化了的动态优化,建立最优性能的动态规划方程,从它的解确定最优的反馈控制规律。

与此同时,计算机的诞生开启了信息时代的大门,也迅速开始与控制领域结合起来。越来越复杂的计算机使得研究者设计了便于计算机计算的数值方法,这种方法后来在控制中变得十分有用。计算机技术的进步使得对离散控制系统的研究日益重要,并开辟了计算机控制这一新的研究领域。

20世纪50年代,美苏两国开始对航天技术展开研究。在浩瀚无垠的太空中运行的航天器,不啻为寄蜉蝣于天地,渺沧海之一粟,因此,为航天器设计行之有效的控制也就显得至关重要。在航天技术中涌现的一系列新问题,亟需利用具有突破性的控制理论加以解决。

苏联学者最具有代表性的成果,是庞特里亚金于1959年提出的最大值原理。最大值原理突破了古典变分法在解决最优控制问题中的局限性,开辟了系统地研究受到状态和控制两方面的约束而使用不连续控制函数的最优轨迹的道路,成为对大量轨迹优化数值计算方法的研究的冲力。

美国学者最具有代表性的贡献,是卡尔曼于1960年提出的卡尔曼滤波器。早期滤波器设计的维纳理论受到关于平稳随机过程的假设和要求解积分方程或分解傅里叶变换的限制,卡尔曼滤波则不受这些限制,而且容易编程实现。卡尔曼滤波是在系统有随机干扰和观测噪声时对状态进行最优估计的最简单高效的方法,因此,原始卡尔曼滤波及其扩展形式,也就被广泛应用于几乎所有需要从噪声和干扰如影随形的数据中估计系统状态的场合。卡尔曼滤波和PID控制是控制理论中以简单方法解决复杂问题,和以普适方法解决不同场合的问题的典型范式;如同李白和杜甫的诗歌在中国文学史上的地位一般,成为控制理论中两座并峙的高峰。

卡尔曼滤波的五个方程


除了提出卡尔曼滤波外,卡尔曼还首先引入状态空间法描述系统,将高阶系统表示为线性微分方程组的向量-矩阵形式,进而提出了能控性、能观性、标准分解等一系列基本概念、模型与方法,几乎以一己之力形塑了线性系统理论的框架。

从线性系统理论的观点看,经典控制理论中的传递函数只描述了系统的能控能观部分。此外,基于时域的、以向量-矩阵形式描述的状态空间表示,不仅在形式上更为自然,而且也更容易在计算机上编程实现。而状态反馈、极点配置、状态观测器等方法的提出,又使得线性系统理论能够完整地指导实际控制系统的设计与校正,而且成为将成果普遍化到非线性系统上的标准典范和对所有新的控制规范的基础,并与最优控制一道开创了现代控制理论

20世纪70年代至今,控制领域又不断涌现出了新的成果,非线性控制、鲁棒控制、自适应控制、随机控制等理论与方法竞相争妍。中国学者也开始在控制领域崭露头角,并取得了丰硕成果。随着计算机科学的发展,尤其是人工智能的发展和计算机硬件的革新换代,控制理论和计算机科学的联系越来越密切。人工智能中的神经网络凸优化等方法在控制领域得到广泛运用,而结合计算机视觉理论对机器人进行控制,又是控制理论与实际结合的一个显例。

控制理论中的反馈概括了很广泛的概念,广义地说,反馈可以作为描述和理解许多系统中发生的循环交互作用的方式。例如,经济学中的蛛网模型是一个存在于价格和数量间的反馈关系。再例如,BP神经网络就可以看作一个反馈;事实上,由于人工神经网络的思想发轫于对人类神经网络的研究,而反馈调节是人类神经系统发挥作用的主要方式,那么神经网络也就天然地带有反馈的思想。

2016年7月2日,控制领域的巨擘卡尔曼溘然长逝。就在卡尔曼逝世四个月前,人工智能棋手AlphaGo击败了世界排名第一的李世石,使得人工智能受到了前所未有的关注。实际上,人工智能从最初的知识学习,到后来的机器学习(统计学习),再到现在由大数据驱动的深度学习,都体现着反馈和优化这两个控制领域的主题。图像识别、语音识别、自然语言处理等领域的一大理论源泉就是控制科学中的模式识别理论;在无人驾驶、智能物流、无人机、移动机器人等应用中,控制理论也发挥着重要作用。甚至可以说,人工智能就是当面对海量数据时,利用计算机实现的控制方法。另一方面,控制理论的未来也有赖于与计算机科学更加紧密和深刻的结合。

从传递函数到状态空间,从PID控制到卡尔曼滤波,控制理论的发展始终与人类社会的发展紧密相连。从蒸汽时代到电气时代再到信息时代,寻找简单高效的普适方法,控制动态系统达到人们期待的性能,始终是技术进步和科学革命所追求的目标,因而也将不断地为控制系统带来崭新的方法、理论和范式。

编辑于 2019-05-16

文章被以下专栏收录

    有关计算机视觉、机器学习、深度学习、SLAM等方面的教程、科普、前沿论文等,以及相关方面的知识(Eg. 数据结构与算法,计算机图形学,机器人学, C++与Python编程,控制理论,等等),或者其他相关内容,欢迎投稿。