DMs[3] Scored-based DDPM
MallocSimenonsNovember 20, 2024About 3 minarticle readingComputer Visiondiffusion
正如 DMs[2] 结尾所提到的,我们可以对 VDM 进行不同的推导,从而得出不同的解释。这里介绍第三种解释方式:score-based DDPM。
这里首先要介绍 Tweedie's Formula:指数族分布的真实均值,可以通过采样样本的经验均值,加上一项修正项进行估计。以 为例:
证明也很简单,假设 的采样数量足够, ,那么对于观测值 :
代入 (1) 式,容易发现,刚好为 。
从 DMs[1] 中可知:
结合 Tweedie's Formula,可知:
而我们是知道 的真实分布的,它由 (3) 式定义。因此, 恰好是 ,我们可以得到如下等式:
和 DMs[2] 中一样,我们又可以据此对 ELBO 中的项进行改写。
Denoising matching term
采取与 DPM 中同样的处理思路,对于确定的参数,我们直接令 与之一致。因此,我们可以将 建模如下:
因此,denoising matching term 转化为:
从 (7) 中可知,参数化模型需要学习在 时的分数 。
Reconstruction term
todo
Explanation of score
我们通过 Tweedie's Formula 引入了分数 ,那么该项在 DPM 中的实际含义是什么呢?回顾 DMs[2] DDPM 中对于 的重写:
可以发现,对于真实分布,分数刚好指向了噪声 的反向,向着分数的方向步进等价于消除噪声。当然,score function 的提出并不是基于 DPM 模型,相关内容可以查看 SMLD。