<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Docs on Qiqi Wu blog</title><link>https://Wuqiqi123.github.io/docs/</link><description>Recent content in Docs on Qiqi Wu blog</description><generator>Hugo</generator><language>en-us</language><lastBuildDate>Sun, 15 Mar 2026 20:40:01 +0800</lastBuildDate><atom:link href="https://Wuqiqi123.github.io/docs/index.xml" rel="self" type="application/rss+xml"/><item><title>Exponential Moving Average</title><link>https://Wuqiqi123.github.io/docs/exponential_moving_average/</link><pubDate>Sun, 15 Mar 2026 20:40:01 +0800</pubDate><guid>https://Wuqiqi123.github.io/docs/exponential_moving_average/</guid><description>&lt;h2 id="adam"&gt;Adam&lt;/h2&gt;
&lt;h2 id="ema"&gt;EMA&lt;/h2&gt;
&lt;h2 id="gae"&gt;GAE&lt;/h2&gt;</description></item><item><title>Monte Carlo Sampling</title><link>https://Wuqiqi123.github.io/docs/monte_carlo_sampling/</link><pubDate>Tue, 10 Mar 2026 20:35:10 +0800</pubDate><guid>https://Wuqiqi123.github.io/docs/monte_carlo_sampling/</guid><description>&lt;h2 id="蒙特卡洛采样-monte-carlo-sampling"&gt;蒙特卡洛采样 (Monte Carlo Sampling)&lt;/h2&gt;
&lt;h2 id="mcmc"&gt;MCMC&lt;/h2&gt;
&lt;h2 id="monte-carlo-tree-search-mcts"&gt;Monte Carlo Tree Search (MCTS)&lt;/h2&gt;
&lt;h2 id="denoising-score-matching"&gt;Denoising Score Matching&lt;/h2&gt;</description></item><item><title>Importance Sampling</title><link>https://Wuqiqi123.github.io/docs/importance_sampling/</link><pubDate>Mon, 09 Mar 2026 22:36:12 +0800</pubDate><guid>https://Wuqiqi123.github.io/docs/importance_sampling/</guid><description>&lt;h2 id="重要性采样-importance-sampling"&gt;重要性采样 (Importance Sampling)&lt;/h2&gt;
&lt;h2 id="grpoppo中的重要性采样"&gt;GRPO/PPO中的重要性采样&lt;/h2&gt;
&lt;h2 id="partial-filter"&gt;Partial filter&lt;/h2&gt;</description></item><item><title>Trust Region Method</title><link>https://Wuqiqi123.github.io/docs/trust_region_method/</link><pubDate>Mon, 09 Mar 2026 22:34:59 +0800</pubDate><guid>https://Wuqiqi123.github.io/docs/trust_region_method/</guid><description>&lt;h2 id="信赖域方法-trust-region-method-的数学原理与实现"&gt;信赖域方法 (Trust Region Method) 的数学原理与实现&lt;/h2&gt;
&lt;h2 id="levenberg-marquardt算法"&gt;Levenberg-Marquardt算法&lt;/h2&gt;
&lt;h2 id="trpo和ppo"&gt;TRPO和PPO&lt;/h2&gt;
&lt;h2 id="sqp-问题的信赖域方法trajopt"&gt;SQP 问题的信赖域方法(trajopt)&lt;/h2&gt;</description></item><item><title>从随机微分方程SDE到扩散模型</title><link>https://Wuqiqi123.github.io/docs/from_sde_to_diffusion/</link><pubDate>Wed, 17 Dec 2025 23:00:05 +0800</pubDate><guid>https://Wuqiqi123.github.io/docs/from_sde_to_diffusion/</guid><description>&lt;h1 id="随机微分方程-sde"&gt;随机微分方程 (SDE)&lt;/h1&gt;
&lt;p&gt;一般的微分方程可以表示为：&lt;/p&gt;
$$\frac{d\textbf{x}}{dt} = f(\textbf{x},t)$$&lt;p&gt;几乎所有更高阶的微分方程都可以转化为这种一阶形式。例如，一个二阶系统（如牛顿第二定律 $F=ma$）可以通过引入辅助变量（令速度 $v = \dot{x}$），将其改写为两个一阶方程组成的向量形式：
&lt;/p&gt;
$$\frac{d}{dt} \begin{bmatrix} x \\ v \end{bmatrix} = \begin{bmatrix} v \\ \frac{F}{m} \end{bmatrix}$$&lt;p&gt;
然而，在许多现实世界的系统中，存在随机性或不确定性，这时我们需要引入随机微分方程 (SDE) 来描述这些系统。
随机微分方程在传统微分方程的基础上，加入了一个随机过程项，通常表示为Wiener过程, SDE 的一般形式可以写成：
\begin{equation}\label{eq:SDE_general}
d\textbf{x} = f(\textbf{x},t)dt + g(\textbf{x},t)d\textbf{W}_t
\end{equation}&lt;/p&gt;
&lt;p&gt;其中$f(\mathbf{x}_t, t)$ 是漂移项。$g(t)$ 是扩散项。$d\mathbf{W}_t$是标准维纳过程：&lt;/p&gt;
&lt;p&gt;维纳过程具有以下核心统计特性，增量 $d\textbf{W}_t = \textbf{W}_{t+dt} - \textbf{W}_t$ 服从均值为向量零、协方差矩阵为 $\textbf{I}dt$ 的正态分布：&lt;/p&gt;
$$d\textbf{W}_t \sim \mathcal{N}(\textbf{0}, \textbf{I}dt)$$&lt;p&gt;
具体来说，它的期望和协方差可以分别表示为：
&lt;/p&gt;
$$\mathbb{E}[d\textbf{W}_t] = \textbf{0}$$&lt;p&gt;
&lt;/p&gt;
$$\text{Var}(d\textbf{W}_t) = \mathbb{E}[d\textbf{W}_t d\textbf{W}_t^T] = \textbf{I}dt$$&lt;p&gt;例如通常在 SLAM 系统中，IMU 传感器的 bias（零偏）可以建模为一个随机游走（Random Walk）过程，其连续时间导数由强度为 $\sigma_b$ 的高斯白噪声 $\mathbf{n}_b(t)$驱动：&lt;/p&gt;</description></item></channel></rss>