信赖域方法 (Trust Region Method) 的数学原理与实现 Levenberg-Marquardt算法 TRPO和PPO SQP 问题的信赖域方法(trajopt)
Trust Region MethodMarch 9, 2026信赖域方法 (Trust Region Method) 的数学原理与实现#Levenberg-Marquardt算法#TRPO和PPO#SQP 问题的信赖域方法(trajopt)#