ADRC学习心得（持续更新）

来源：筏尚旅游网

两年前第一次接触到PID觉得很高深，很神奇；后来逐渐觉得单纯的PID小儿科了，又了解到专家PID，模糊PID，神经网络PID这些改进算法，再后来又知道了ADRC，便感控制领域浩如烟海，所学不过沧海一粟。然便纵真理无穷，进一寸自有一寸的欢喜。
不敢说看了几篇论文，听了几节报告，做了几次仿真，就吃透ADRC了，不过只是一些粗浅的理解，记录一行歪歪斜斜的足迹。以便回首过眼云烟之时，可以安慰自己一句，我已经飞过。

一、系统有关概念

1、系统的状态空间模型

描述一个系统，最常用的数学模型有：

微分方程
传递函数
状态空间

其中状态空间模型常用于对系统进行数学计算。状态空间模型用状态方程表示。
$\left\{ \begin{array}{c} \dot{x}=Ax+Bu \\ y=Cx+Du \end{array} \right. (1-1)$
ABCD是四个矩阵， $x$ 为状态向量，里面包含的状态变量个数一般等于系统阶数，且相互独立。 $y$ 为系统输出向量。
状态变量的选取一般是：
$x_1=y, x_2=\frac{dy}{dt}, ..., x_n=\frac{d^{n-1}y}{dt^{n-1}}$

2、系统的状态观测

设计反馈的时候需要知道系统内部的状态变量 $x$ 。大部分情况下 $x$ 是不知道的，需要用一个观测器，通过系统的输入输出，去把它观测出来。如果在状态变量 $x$ 中包含了系统的扰动，那么在观测出来之后，就可以在控制器中把系统扰动尽可能消除。观测出的状态变量称为 $\hat{x}$ 。那么状态观测器的任务，就是使得 $x$ 的状态估计 $\hat{x}$ 尽可能接近 $x$ 。通常按照copycat的思路来设计状态观测去，即设计一个相同结构的系统 $\dot{\hat{x}}=A\hat{x}+Bu+L(y-\hat{y})$ ，其中 $L(y-\hat{y})$ 这一项是矫正项。 $L$ 为矫正项增益矩阵。用数学公式表达如下：
$\left\{ \begin{array}{c} e_{obs}=x-\hat{x}\\ \dot{x}=Ax+Bu\\ \dot{\hat{x}}=A\hat{x}+By+L(y-\hat{y}) \end{array} \right. \ \ \ \ \ \ \ \ (1-2)$ 通过数学变换，可以得到： $\dot{e_{obs}}=(A-LC)e_{obs} \ \ \ \ \ \ \ \ (1-3)$ 这个方程的解是 $e_{obs}(t)=e^{(A-LC)t}e_{obs}(0) \ \ \ \ \ \ \ \ (1-4)$ 可以看出，（A-LC）这一项决定了观测器的收敛速度。当 $e_{obs}$ 降到 0 的时候，也就意味着 $x$ 和 $\hat{x}$ 相等，同时矫正项 $L(y-\hat{y})=0$ 。这就是状态观测器的数学模型。ADRC的核心是一个扩张状态观测器，它比一般的状态观测器多了一个总扰动的项，但基础是一样的。

二、ADRC控制器的结构

1、TD（跟踪微分器)

跟踪微分器实际上就是一个事先的过渡过程。提取含有随机噪声的输入信号及其微分，这两个值将被一起送入控制器。也就是说，TD的输入信号只有一个，即给定值，输出信号有两个。这样做的目的是解决PID控制器超调和响应速度之间的矛盾。
然而，微分运算对噪声有很严重的放大效果。由于真正意义上的微分环节（ $G (s) = s$ ）是无法在物理上实现的，因此通常用一阶惯性环节（ $G(s)=\frac{s}{Ts+1}$ ）来代替。但是对于一阶惯性环节，要想追求逼近性好，就会不可避免的引入噪声的放大。因此，为了抑制高频噪声，考虑用一个二阶环节来取代一阶环节。当二阶系统处于临界阻尼状态，则过渡过程就不会产生超调。 $G(s)=\frac{s}{(Ts+1)^2}$ 式中，当时间常数T很小的时候有 $\lim_{T \to 0} \frac{s}{(Ts+1)^2}\quad=s$ ，也有微分的效果。并且这个二阶系统对于高频噪声有很高的抑制能力。因此TD中采用的通常是这种结构。过渡过程的阶数一般根据系统来决定，与系统同阶或者比系统高一阶。

2、ESO（扩张状态观测器）

ESO是ADRC控制器的核心，可以用一个扩张状态方程来描述。通过扩张状态观测的方式把系统上和输入量（u）无关的所有杂项（扰动）全部观测出来，以便用控制器去补偿这些扰动。设计ESO的思路如下：
考虑一个二阶系统：
$\ddot{ y}=a\dot{y}+by+cu+d \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ (2-1)$ $d$ 为扰动。显然二阶系统的状态变量有两个， $x_1$ 和 $x_2$ 。一般情况下如果要写出状态方程的话应该是二阶的，即有两个状态变量。为了将扰动 $d$ 也纳入状态观测器，建立第三个状态变量 $x_3$ ，使其等于 $a\dot{y}+by+d$ ，即上式中除了输入 $u$ 之外的其他项（也可称作总扰动）。令 $\dot{x_3}=h$ ，那么按照一般状态方程的写法，可以列写出上面这个二阶系统的状态方程：
$\begin{bmatrix} \dot{x_1} \\ \dot{x_2} \\ \dot{x_3} \\ \end{bmatrix} =\begin{bmatrix} 0&1&0 \\ 0&0&1 \\0&0&0 \\ \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ x_3 \\ \end{bmatrix} + \begin{bmatrix} 0 \\ c \\ 0 \\ \end{bmatrix}u + \begin{bmatrix}0 \\0 \\ 1 \\ \end{bmatrix}h\ \ \ \ \ \ \ (2-2)$ 和输出方程：
$\begin{bmatrix} 1 & 0 & 0 \\ \end{bmatrix}\begin{bmatrix} x_1 \\ x_2 \\ x_3 \\ \end{bmatrix}\ \ \ \ \ \ \ (2-3)$ 这个状态方程即被称为扩张状态方程。扩张状态观测器的设计和传统状态观测器类似，也是 $\left\{ \begin{array}{c} \dot{\hat{x}}=A\hat{x}+Bu+L(y-\hat{y})+Eh\\ \hat{y}=C\hat{x} \end{array} \right. \ \ \ \ \ \ \ (2-4)$ 其中 $E h$ 这一项和模型有关，大部分情况下是未知的，因此通常这一项被直接忽略,不然放着也没用。由于有了矫正项 $L(y-\hat{y})$ $(L$ 状是态观测器的增益矩阵，记为 $\begin{bmatrix} l_1\\ l_2 \\ l_3\\ \end{bmatrix}$ )，因此观测器中的矩阵A、B、C、D（为了区分记为 $A_1、B_1、C_1、D_1$ ）和状态方程中的矩阵A、B、C、D是不一样的。

通过一定的数学变换，状态观测器方程(2-4)可化为如下形式：
$\dot{\hat{x}}=(A-LC_1)\hat{x}+\begin{bmatrix} B&L \\ \end{bmatrix}\begin{bmatrix} u\\y \\ \end{bmatrix}$ 观测器中的系统矩阵 $A_1=A-LC_1$ ，即 $A_1=\begin{bmatrix} -l_1&1&0 \\ -l_2&0&1 \\-l_3&0&0 \\ \end{bmatrix}$ ，而新的输入矩阵； $B_1=\begin{bmatrix} B&L \\ \end{bmatrix}$ ，即 $B_1=\begin{bmatrix}0& -l_1 \\ c&-l_2 \\0&-l_3 \\ \end{bmatrix}$ 为新的控制矩阵（ $c$ 是原二阶系统中输入 $u$ 的系数）， $\begin{bmatrix} u\\y \\ \end{bmatrix}$ 两个一起作为观测器输入；状态观测器的输出 $\hat{y}$ 实际上包含3个分量，即 $\hat{y}=C_1\begin{bmatrix} \hat{x_1} \\ \hat{x_2} \\ \hat{x_3} \\ \end{bmatrix}$ 那么在观测器的输出方程中， $C_1$ 就是一个三阶单位矩阵，因为 $\hat{y}=\hat{x}$ ； $D_1$ 是零矩阵。
为了让观测器系统稳定，需要进行极点配置。假设让这个三阶的状态观测器的三个极点全部位于左半平面的 $ω_0$ 处，则增益 $L$ 就需要特别设计。令 $A_1$ 的特征值 = $ω_0$ ，可解得 $l_1=3\omega_0，l_2=3\omega_0^2，l_3=\omega_0^2$ 。 $ω_0$ 即是观测器的带宽，应当根据实际系统来设计。如果带宽选择过小，可能会导致扩张状态 $x_3$ 的观测 $\hat{x_3}$ 的跟随性变差，带宽选择过大的话有可能会引入额外的噪声。 $u$ 的系数 $c$ 在设计的时候有可能是不知道的，但是仿真表明 $c$ 的选择即使跟真实的系统有偏差，ESO也能正常工作（但这一点目前尚无严格的理论证明）。至此，扩张状态观测器设计完成！！

3、NLSEF（控制器）

ADRC的控制器部分的输入包含两个部分，分别是TD的输出结果（输入信号及其微分）和ESO的输出（包含三个元素的状态向量 $\hat{y}$ ）。因此它就有5个输入量。其中 $\hat{y}$ 的第三个分量 $\hat{x_3}$ 的作用，是通过观测，将复杂系统转化为纯积分器，简化控制。
依然是这个二阶系统
$\ddot{ y}=a\dot{y}+by+cu+d$ 扩张状态 $x_3=a\dot{y}+by+d$ 。假设状态观测器工作顺利， $x_3$ 的观测值 $\hat{x_3}$ 就等于真实的 $x_3$ ，即满足 $x_3=\hat{x_3}$ 那么将系统的输入，也即控制器的输出 $u$ 设计为 $u=\frac{u_0-\hat{x_3}}{c}$ 带入上面的二阶系统，可以得到 $\ddot{y}=u_0$ 即一个二阶积分器。设计一个PD控制器来控制 $u_0$ ：(一般稳态的时候给定的目标值（reference）都是恒定的，即 $\dot{r}=0$ ， $\ddot{r}$ 为前馈项，用于去除稳态误差。但很多时候都是把它忽略的，加上这一项之后有可能会影响响应速度) $u_0=K_p(r-x_1)+K_d(\dot{r}-x_2)+\ddot{r}$ 同样按照极点配置的方法，可得到 $K_p=ω_c^2$ ， $K_=2ω_c$ 。如此，控制器传递函数中阻尼系数 $ξ = 1$ ，处于临界阻尼，系统无超调。当然 $K_p、K_d$ 设计的方法很多，可以综合超调和响应速度来调节。

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目