信赖域方法 (Trust Region Method) 的数学原理与实现

Levenberg-Marquardt算法

TRPO和PPO

SQP 问题的信赖域方法(trajopt)