像素组成的多元高斯能学到像素之间的关系。TheMatrix2 写了: 2022年 9月 9日 15:24 我也没想明白。我说一点感想吧。
根据一个图片集,学习生成一个新图片。常规的想法是把图片分割成components,找出频率,然后组合。这种显然可以生成边界清晰的图片。但是diffusion model不是,它不分割components,它逐点进行,一大片的进行,最后也能得到边界清晰的图片。这个方法真的很AI。
比如像素f(x,y)=100, f(x, y+1)=200, f(x, y+2)=200... f(x+1, y)=f(x+2, y)=100 映射是坐标-->像素intensity
那说明图里高度为y的地方可能有一条横着的边界线
训练出来的高斯能通过像素之间的covariance来纪录这种特征,让有清晰边界的图像likelihood比乱糟糟的图像大


