Flow学习笔记

生成式模型

generate something——generate samples from data distributions
A generative model——convert samples from a initial distribution(e.g.Gaussian) into samples from the data distribution 生成过程

组成

一个空间的向量场 $u_t$（神经网络）定义了一个常微分方程（ODE），轨迹 $X_t$ 是ODE在某初始条件下的一个解，flow——$Φ_t（x_0）$则是针对不同初始条件的一系列解的集合
ODE（用于流匹配模型，本文采用）： $X_0=x_0, \quad \frac{dX_t}{dt} = u_t(X_t)$
SDE（在ODE基础上添加扩散系数σt，用于扩散模型）：
$X_0=x_0, \quad dX_t = u_t(X_t)dt + σ_tdW_t$

训练目标

Diffusion Loss

foward process：$x_t = \alpha_tx_0 + \sigma_t \epsilon, \quad \epsilon \sim\mathcal{N}(0,I)$ $\quad\rightarrow$ 从原图$x_0$出发，沿着噪声方向$\epsilon$添加噪声，得到$x_t$
loss function：$L_{diff} = E_{t,x_0,z} [|\epsilon - \epsilon_\theta(x_t, t)|^2]$ $\quad\rightarrow$ 学习噪声方向

Flow Matching Loss

target ground path：$X_t = (1-t)x_0 + tx_1$ $\quad\rightarrow$ 线性插值路径作为目标轨迹，注意此处$x_1$是真实数据图，$x_0$为初始高斯分布，与diffusion中表示相反
loss function：$L_{flow} = E_{t,x_0,x_1} [|u_t(X_t) - (x_1 - x_0)|^2]$ $\quad\rightarrow$ 学习向量场使得ODE轨迹逼近目标路径