Skip to content
ComfyUI Wiki
Помогите создать лучшую базу знаний ComfyUI Стать спонсором
Глоссарий ComfyUI

Глоссарий ComfyUI

CLIP

CLIP (Contrastive Language-Image Pretraining) — это модель, разработанная OpenAI, которая связывает информацию об изображениях и тексте. Она способна понимать взаимосвязь между изображениями и текстом, что помогает создавать изображения, описывать их или выполнять задачи классификации изображений.

Диффузионная модель

Диффузионная модель — это генеративная модель, которая постепенно добавляет шум к данным, а затем обучается удалять этот шум для генерации новых данных. Такие модели хорошо справляются с созданием изображений и других видов данных. Процесс обучения диффузионных моделей включает прямой процесс (добавление шума) и обратный процесс (удаление шума).

Денойзинг

Денойзинг — это процесс восстановления чистой информации из зашумленных изображений или данных. В диффузионных моделях денойзинг означает, что модель постепенно уменьшает шум, чтобы восстановить данные, делая сгенерированные изображения максимально похожими на реальные.

Латентное представление

Латентное представление — это скрытая характеристика или признак, используемый для описания данных в генеративных моделях. Это абстрактное, низкоразмерное представление данных (например, изображений), получаемое с помощью энкодера и отражающее основные свойства данных.

Латентное пространство

Латентное пространство — это многомерное пространство, в котором представлены латентные признаки данных. В генеративных моделях данные сначала преобразуются в латентное пространство, а затем из него с помощью декодера создаются новые данные. Особенности латентного пространства позволяют модели генерировать разнообразные и сложные примеры данных.

VAE

VAE (Вариационный автокодировщик, Variational Autoencoder) — это генеративная модель, предназначенная для изучения латентного представления данных с помощью энкодера и декодера. Энкодер преобразует входные данные в латентное пространство, а декодер создает новые данные на основе этих латентных представлений. Цель VAE — максимизировать вероятность данных и минимизировать расхождение между распределением латентного пространства и заранее заданным распределением.