Model difusi CDM dilatih pada data ImageNet untuk menghasilkan gambar alami beresolusi tinggi. Karena ImageNet adalah kumpulan data entropi tinggi yang sulit, Google membangun CDM sebagai kaskade dari beberapa model difusi.
Pendekatan kaskade ini melibatkan rantai bersama beberapa model generatif melalui beberapa resolusi spasial. Rantai tersebut mencakup satu model difusi yang menghasilkan data pada resolusi rendah diikuti oleh urutan model difusi super-resolusi SR3 yang secara bertahap meningkatkan resolusi gambar yang dihasilkan ke resolusi tertinggi.
Baca Juga: Taliban Lakukan Parade Kemenangan, Pamer Puluhan Kendaraan Lapis Baja dan Pertunjukan Udara
Google mengatakan itu menerapkan noise Gaussian dan Gaussian blur ke gambar input resolusi rendah dari setiap model resolusi super dalam pipa cascading. Ini menyebut proses ini sebagai augmentasi pengkondisian dan memungkinkan kualitas sampel resolusi yang lebih baik dan lebih tinggi untuk CDM.
Dengan SR3 dan CDM, Google mengatakan telah mendorong kinerja model difusi ke tingkat yang paling mutakhir pada tolok ukur generasi ImageNet resolusi super dan kelas bersyarat.***