生成式模型
generate something——generate samples from data distributions
A generative model——convert samples from a initial distribution(e.g.Gaussian) into samples from the data distribution

组成
一个空间的向量场 $u_t$(神经网络)定义了一个常微分方程(ODE),轨迹 $X_t$ 是ODE在某初始条件下的一个解,flow——$Φ_t(x_0)$则是针对不同初始条件的一系列解的集合
ODE(用于流匹配模型,本文采用):
$X_0=x_0, \quad \frac{dX_t}{dt} = u_t(X_t)$
SDE(在ODE基础上添加扩散系数σt,用于扩散模型):
$X_0=x_0, \quad dX_t = u_t(X_t)dt + σ_tdW_t$
训练目标
Diffusion Loss
- foward process:$x_t = \alpha_tx_0 + \sigma_t \epsilon, \quad \epsilon \sim\mathcal{N}(0,I)$ $\quad\rightarrow$ 从原图$x_0$出发,沿着噪声方向$\epsilon$添加噪声,得到$x_t$
- loss function:$L_{diff} = E_{t,x_0,z} [|\epsilon - \epsilon_\theta(x_t, t)|^2]$ $\quad\rightarrow$ 学习噪声方向
Flow Matching Loss
- target ground path:$X_t = (1-t)x_0 + tx_1$ $\quad\rightarrow$ 线性插值路径作为目标轨迹,注意此处$x_1$是真实数据图,$x_0$为初始高斯分布,与diffusion中表示相反
- loss function:$L_{flow} = E_{t,x_0,x_1} [|u_t(X_t) - (x_1 - x_0)|^2]$ $\quad\rightarrow$ 学习向量场使得ODE轨迹逼近目标路径