Black Forest Labs выпускает открытую версию FLUX.1 Krea [dev] с нативной поддержкой ComfyUI
31.07.2025
Глоссарий ComfyUI
CLIP
CLIP (Contrastive Language-Image Pretraining) — это модель, разработанная OpenAI, которая связывает информацию об изображениях и тексте. Она способна понимать взаимосвязь между изображениями и текстом, что помогает создавать изображения, описывать их или выполнять задачи классификации изображений.
Диффузионная модель
Диффузионная модель — это генеративная модель, которая постепенно добавляет шум к данным, а затем обучается удалять этот шум для генерации новых данных. Такие модели хорошо справляются с созданием изображений и других видов данных. Процесс обучения диффузионных моделей включает прямой процесс (добавление шума) и обратный процесс (удаление шума).
Денойзинг
Денойзинг — это процесс восстановления чистой информации из зашумленных изображений или данных. В диффузионных моделях денойзинг означает, что модель постепенно уменьшает шум, чтобы восстановить данные, делая сгенерированные изображения максимально похожими на реальные.
Латентное представление
Латентное представление — это скрытая характеристика или признак, используемый для описания данных в генеративных моделях. Это абстрактное, низкоразмерное представление данных (например, изображений), получаемое с помощью энкодера и отражающее основные свойства данных.
Латентное пространство
Латентное пространство — это многомерное пространство, в котором представлены латентные признаки данных. В генеративных моделях данные сначала преобразуются в латентное пространство, а затем из него с помощью декодера создаются новые данные. Особенности латентного пространства позволяют модели генерировать разнообразные и сложные примеры данных.
VAE
VAE (Вариационный автокодировщик, Variational Autoencoder) — это генеративная модель, предназначенная для изучения латентного представления данных с помощью энкодера и декодера. Энкодер преобразует входные данные в латентное пространство, а декодер создает новые данные на основе этих латентных представлений. Цель VAE — максимизировать вероятность данных и минимизировать расхождение между распределением латентного пространства и заранее заданным распределением.