Apollo源码深度(九)——控制:MPC写了不用,LQR才是默认值

从飞控转自动驾驶，我最先困惑的是控制

写飞控那几年，PX4的串级PID是我最熟悉的武器。位置环50Hz、速度环50Hz、姿态环250Hz、角速度环直接干到1000Hz。四层PID嵌套，外层输出喂给内层，最内层以2.5毫秒的周期死磕电机PWM。这套架构飞了无数架飞机，稳定得像物理定律。

转到自动驾驶，打开Apollo的modules/control/目录，我愣了一下。

三个子目录：mpc_controller、lat_based_lqr_controller、lon_based_pid_controller。三套控制器并排摆着，不是串联，是可选。

PX4那种从位置一路串到角速度的四层嵌套，在Apollo里压根不存在。取而代之的是横向和纵向的解耦思路，每条路上挂一套独立控制器。

控制模块到底干什么

据Apollo官方文档（https://apolloauto.readthedocs.io/en/latest/howto/how_to_tune_control_parameters/ ）描述，控制模块接收三样输入：规划轨迹、当前车辆状态、HMI驾驶模式指令，输出方向盘、油门、刹车控制命令。规划告诉你未来沿这条曲线走，控制负责算出此刻方向盘打多少度、油门踩多深。

据51CTO博客对Apollo源码的分析（https://blog.51cto.com/u_15941409/14427989 ），ControlComponent继承自TimerComponent，定时执行。流程是数据校验、Pad指令检查、调度控制器生成ControlCommand、俯仰角补偿、发布指令。

我在实车上跑过这套流程。TrajectoryAnalyzer先做轨迹匹配——找到当前时刻在规划轨迹上最近的点，算出横向误差、航向误差、纵向位置误差。这些误差就是控制器的输入。

MPC：用QP求解未来10步的最优控制

打开mpc_controller.h（https://tracelessle.github.io/apollo6.0-doxygen/html/mpc__controller_8h_source.html ），几个关键常量跳出来：

constint basic_state_size_ = 6;
constint controls_ = 2;
constint horizon_ = 10;

6个状态量、2个控制量、预测步长10。状态向量是[e_y, e_y_dot, e_theta, e_theta_dot, e_s, e_s_dot]，分别是横向误差、横向误差变化率、航向误差、航向误差变化率、纵向位置误差、纵向速度误差。控制量是方向盘转角delta_f和加速度a。

MPC的思路说白了：每个控制周期，基于当前状态预测未来10步的轨迹，同时优化这10步的控制输入序列，使得代价函数最小。代价函数长这样：

J = Σ[x(k)ᵀ Q x(k) + u(k)ᵀ R u(k)]

Q矩阵惩罚状态偏差，R矩阵惩罚控制量大小。约束包括系统动力学方程x(k+1) = A·x(k) + B·u(k)、控制输入上下界、状态上下界。

据DeepWiki对Apollo源码的分析（https://deepwiki.com/ApolloAuto/apollo/6.1-mpc-controller ），Apollo用OSQP求解器来解这个QP。MpcOsqp类把整个MPC问题打包成标准QP形式——稀疏矩阵P和q构成代价函数，约束矩阵A配合上下界l和u。每次控制周期调一次Solve()，拿到最优控制序列，只用第一步。

滚动优化。下一周期重新测量状态，重新求解。这是MPC和LQR的根本区别——MPC每步都在解一个优化问题，LQR一次性算好增益矩阵，之后只是矩阵乘法。

MPCController类里还有几个值得注意的方法。UpdateState负责从定位和底盘数据更新当前状态向量，UpdateMatrix在每个周期重新计算离散化的状态转移矩阵A_d和控制矩阵B_d——因为速度变了，动力学矩阵就变了。FeedforwardUpdate做前馈补偿，利用路径曲率信息提前给出方向盘转角，减少稳态误差。ComputeLateralErrors和ComputeLongitudinalErrors分别算横向和纵向误差，前者依赖位置和航向，后者依赖TrajectoryAnalyzer的匹配结果。这些方法串起来就是一次完整的控制周期：更新状态、更新矩阵、前馈补偿、求解QP、输出指令。

源码里还有数字滤波器的初始化逻辑，InitializeFilters根据配置文件设置截止频率和滤波器系数。方向盘输出前要过一道低通滤波，避免QP求解结果的高频抖动直接灌进转向执行器。这个细节我在实车上踩过坑——滤波器截止频率设太高，方向盘会抖；设太低，响应延迟，弯道入口总是慢半拍。

LQR：Riccati方程一次解，后面全是乘法

LQR控制器在lat_based_lqr_controller目录下。据Apollo官方调参文档，横向LQR控制器的车辆模型是带侧滑的bicycle model——动力学模型，不是纯运动学模型。状态量4个：横向误差、横向误差变化率、航向误差、航向误差变化率。

LQR的核心是求解离散Riccati方程，拿到最优状态反馈增益K。控制律极其简洁：u = -K·x。K矩阵在车辆参数和速度确定后可以离线计算，运行时只做一次矩阵乘法。

配置文件里Q矩阵的4个对角元素分别对应横向误差权重、横向误差率权重、航向误差权重、航向误差率权重。Lincoln MKZ的典型配置是matrix_q: [0.05, 0.0, 1.0, 0.0]——航向误差权重最高，横向误差率权重为零。航向跟住了，横向位置自然收敛。调参顺序文档写得很清楚：先调航向误差权重消除航向偏差，再调横向误差权重收敛位置。

车辆参数写得细：前后轮侧偏刚度cf和cr、轴距wheelbase、整车质量mass、质心到前后轴距离lf和lr、转动惯量iz。这些参数直接进动力学方程构建状态矩阵A和控制矩阵B。速度变化时A和B会变，Apollo在不同速度下重新计算增益——这是和固定增益PID的本质区别。

源码里有个SolveLQRProblem函数，接收连续时间的A和B矩阵，先做离散化得到A_d和B_d，然后迭代求解离散Riccati方程直到收敛。迭代次数和收敛阈值在配置文件里可调，默认最大迭代100次。每次速度变化超过阈值就重新算一遍增益，算完缓存下来，下一个周期直接用。我在调试时发现一个现象：速度从30km/h跳到60km/h的瞬间，增益矩阵K的变化幅度不小，方向盘指令会有一个明显的阶跃。解决方式是在速度变化时做增益插值平滑，不让K矩阵跳变。

PID：纵向速度跟踪，级联加标定表

纵向控制用PID，代码在lon_based_pid_controller。不是单环，是级联结构——位置PID外环输出喂给速度PID内环。位置控制器输出期望速度修正量，速度控制器输出期望加速度。

高速和低速用不同PID参数。典型配置：高速时kp=1.0, ki=0.3, kd=0.0，低速时kp=0.5, ki=0.3, kd=0.0。切换速度一般设在一个coasting speed附近。

PID输出加速度后，还要过一道标定表。这张表是实车测出来的查找表，把目标加速度映射成具体的油门开度百分比或刹车压力。不同车速下同样的加速度需求对应不同的踏板开度，标定表补偿的就是这种非线性。

Apollo还在PID上加了数字滤波器做噪声抑制，前馈控制器做相位补偿。这些都是在基础PID上打补丁，弥补PID本身没有模型预测能力的短板。

默认为什么是LQR+PID而不是MPC

这是个好问题。Apollo的默认配置是LQR管横向、PID管纵向。MPC作为可选项存在，不是默认。

原因可以拆成几层。

MPC每次控制周期都要解一个QP。状态维度6、控制维度2、预测步长10，决策变量规模不算大，但OSQP的求解时间不是零。据DeepWiki分析，OSQP的收敛速度依赖问题条件数，最大迭代次数和收敛容差都可配置。LQR呢？增益矩阵K预先算好，运行时只做一次1乘4的矩阵乘法——K是1×4的行向量，乘上4维状态向量，直接输出方向盘转角。在嵌入式控制器算力有限的车载平台上，这个差距是实打实的。

约束处理是MPC的杀手锏。方向盘转角上限、加速度上下界、方向盘转速限制，MPC能显式塞进优化问题里。LQR做不到——它只管最优，不管约束。遇到约束边界，LQR的输出可能物理上不可执行，只能靠后处理硬裁剪。

那默认还用LQR？因为LQR+PID在大多数场景下够用了。直线巡航、温和变道、常规跟车，LQR的跟踪精度和MPC差距不大。真正需要MPC发力的极端场景——急转弯、大曲率连续弯道、紧急避障——在量产L2/L3里频率不高。工程上够用就是最好的选择。

和PX4的四层串级PID放一起看

据PX4官方文档（https://docs.px4.io/v1.15/en/flight_stack/controller_diagrams ），多旋翼控制架构是教科书级的串级PID：位置环P控制器、速度环PID、姿态环P（四元数）、角速度环PID。四层从外到内频率递增，最外层50Hz，最内层1000Hz。外层输出是内层的设定值，信号从上往下流，反馈从下往上回。

Apollo的思路完全不同。不搞多层级联，把控制问题拆成横向和纵向两个独立维度。横向用模型预测控制或LQR，纵向用PID。没有外层输出喂内层的串级结构，每套控制器直接算出最终控制量。

原因在于被控对象不同。多旋翼是欠驱动系统，四个电机直接控制六个自由度，姿态和位置强耦合——不调姿态就没法控制水平位置。串级PID天然适合这种耦合：先稳住角速度，再稳姿态，再稳速度，再稳位置。

汽车不一样。方向盘直接管横向，油门刹车直接管纵向，两个维度基本解耦。横向和纵向可以独立设计控制器，不需要串级结构。Apollo用bicycle model描述横向动力学，把轮胎侧偏特性纳入模型，比纯PID更准。纵向更简单，速度跟踪用PID加标定表就够了。

争论一：MPC还是LQR

技术社区吵了好几年的问题。MPC能处理约束，LQR不能。MPC每步解QP，LQR只做矩阵乘法。MPC可以预测未来，LQR只有瞬时反馈。

支持MPC的人说，自动驾驶的安全场景就是约束边界场景——方向盘打到极限、急刹到轮胎抱死。这些场景下MPC的约束处理能力是保命的能力。LQR在约束边界处行为不可预测，只能靠硬裁剪，裁完了就不再最优。

支持LQR的人说，车载控制器算力有限，MPC的QP求解时间在最坏情况下不可控。OSQP虽然有迭代上限，但收敛速度依赖问题条件数。如果QP发散，MPC输出的控制指令可能比PID还差。LQR的增益矩阵离线算好，运行时零不确定性。

我的看法：Apollo的做法其实给了答案——默认LQR+PID兜底，MPC作为高性能选项。不是非此即彼，是分层兜底。但这也引出一个工程问题：两套控制器的行为一致性怎么保证？LQR和MPC在同一个弯道给出的方向盘角度可能差好几度，切换瞬间的跳变怎么处理？Apollo的源码里我没找到特别优雅的平滑过渡机制。

争论二：bicycle model够不够用

Apollo的LQR和MPC用的都是bicycle model——把汽车简化成一根车轴上前后两个轮子。模型里只有侧偏刚度cf和cr，没有轮胎的非线性特性、没有悬架动力学、没有路面附着系数。

这个简化在低速和干燥路面下问题不大。高速过弯或湿滑路面时，bicycle model的预测精度明显下降。轮胎侧偏力在大侧偏角下进入非线性区，bicycle model的线性假设失效。有团队在GitHub上提过issue，反映Apollo的LQR在80km/h以上大曲率弯道横向误差明显增大。

完整车辆动力学模型需要更多参数——Pacejka轮胎模型参数、悬架K&C特性、空气动力学系数——标定成本极高。bicycle model只需要cf、cr、mass、lf、lr、iz六个参数，工程上可落地。这是精度和工程可行性的经典权衡。学术上可以用完整轮胎模型加多自由度悬架动力学，但参数标定的成本和时间周期在量产项目中不可接受。

留个问题

PX4用四层串级PID飞了十年，Apollo用bicycle model加LQR跑了百万公里。两套系统被控对象不同，不能直接类比。但有个问题一直困扰我：如果给汽车也上四层串级PID——位置环管轨迹跟踪、速度环管纵向、横摆角速度环管横向稳定性、转向角环管执行器——理论上行得通，为什么没有主流自动驾驶公司这么做？

PID的调参经验积累太厚是原因之一。但更深层的原因，我猜是控制频率。PX4最内层1000Hz，汽车CAN总线控制周期通常100Hz。频率差一个数量级，串级PID的内环增益来不及响应。

这个猜测对不对，我不确定。欢迎拍砖。