Как в общих чертах происходит процесс
обучения диффузионной модели? Как
преобразуются исходные данные? Что
ожидается на выходе модели?
Назовите основные компоненты диффузионной
модели.
В чем заключается роль CLIP
в процессе диффузии?
В чем заключается роль VAE
в процессе диффузии?
В чем заключается роль U-NET
в процессе диффузии?
Для чего при преобразовании фразы в
эмбеддинги добавляется дополнительная
случайная фраза?
Что нужно подать на вход U-Net
в самом начале чтобы получить уникальное
изображение?