Glosario de ComfyUI
CLIP
CLIP (Preentrenamiento Contrastivo de Lenguaje e Imagen) es un modelo desarrollado por OpenAI que conecta la información de imágenes y texto. Puede entender la relación entre imágenes y texto, ayudando a generar imágenes, describir imágenes o realizar tareas de clasificación de imágenes.
modelo de difusión
Un modelo de difusión es un modelo generativo que añade ruido gradualmente a los datos y luego entrena un modelo para eliminar el ruido con el fin de generar datos. Ha demostrado tener fuertes capacidades en la generación de imágenes y otros tipos de datos. El proceso de entrenamiento de los modelos de difusión incluye un proceso hacia adelante (añadiendo ruido) y un proceso inverso (eliminando ruido).
eliminar ruido
Eliminar ruido se refiere al proceso de recuperar información clara de imágenes o datos ruidosos. En los modelos de difusión, eliminar ruido implica que el modelo reduce gradualmente el ruido para restaurar los datos, haciendo que las imágenes generadas sean lo más parecidas posible a las imágenes reales.
Latente
Latente se refiere a la representación oculta o características utilizadas para representar datos en modelos generativos. Es una representación abstracta y de baja dimensión de los datos (por ejemplo, imágenes) obtenida a través de un codificador, capturando las características fundamentales de los datos.
espacio latente
El espacio latente es un espacio de alta dimensión utilizado para representar las características latentes de los datos. En los modelos generativos, los datos se mapean primero en el espacio latente y luego se generan nuevos datos a partir del espacio latente a través de un decodificador. Las características del espacio latente permiten al modelo generar una variedad de muestras de datos complejas.
VAE
VAE (Autoencoder Variacional) es un modelo generativo diseñado para aprender la representación latente de los datos a través de un codificador y un decodificador. El codificador mapea los datos de entrada en el espacio latente, mientras que el decodificador genera nuevos datos a partir de las representaciones latentes. El objetivo de un VAE es maximizar la probabilidad de los datos mientras minimiza la divergencia entre la distribución del espacio latente y la distribución predefinida.