Trust Region Method

March 9, 2026

信赖域方法 (Trust Region Method) 的数学原理与实现

Levenberg-Marquardt算法

TRPO和PPO

SQP 问题的信赖域方法(trajopt)

© 2026 Qiqi Wu blog · Powered by Hugo & PaperMod