ByteDance发布Sa2VA:首个图像视频统一理解模型
2025/10/17
CLIP Text Encode(prompt) - CLIP文本编码器

文档说明
- 类名:
CLIP文本编码 - 类别:
条件 - 输出节点:
False
这个节点主要通过输入Prompt(文本提示词),通过CLIP模型对输入的文本进行编码,生成一个嵌入向量,用来引导diffusion model扩散模型生成符合文本条件图像
除了正常的文本提示词之外也可以用于输入 embedding 模型,比如你在对应的模型目录 ComfyUI/models/embeddings 下添加了 embedding 模型,那么你就可以在提示词中使用这个 embedding 模型。
假设对应的模型名称为EasyNegative,那么你可以在提示词中使用 embedding:EasyNegative, 来使用这个对应的模型
输入类型
| 参数名称 | 数据类型 | 作用 |
|---|---|---|
text | STRING | text 参数是要编码的文本输入。它在确定输出条件向量中起着关键作用,因为它是编码过程的主要信息源。 |
clip | CLIP | clip 参数代表用于文本标记化和编码的CLIP模型。它对于将文本输入转换为条件向量至关重要,影响生成输出的质量和相关性。 |
输出类型
| 参数名称 | 数据类型 | 作用 |
|---|---|---|
conditioning | CONDITIONING | 输出的conditioning是由CLIP模型编码的输入文本的向量表示。它作为指导生成模型产生相关和连贯输出的关键组件。 |