Skip to content

Latest commit

 

History

History
1107 lines (853 loc) · 65.1 KB

README_CN.MD

File metadata and controls

1107 lines (853 loc) · 65.1 KB

ComfyUI Layer Style Advance

ComfyUI Layer Style 剥离出来的节点,主要是一些对依赖包要求较为复杂的节点。

工作流用示例

在workflow目录下有json格式的工作流示例文件,示范了如何在ComfyUI中使用这些节点。

安装方法

(以ComfyUI官方便携包和秋叶整合包为例,其他ComfyUI环境请修改依赖环境目录)

安装插件

  • 推荐使用 ComfyUI Manager 安装。
  • 或者在CompyUI插件目录(例如“CompyUI\custom_nodes\”)中打开cmd窗口,键入
git clone https://github.com/chflame163/ComfyUI_LayerStyle_Advance.git
  • 或者下载解压zip文件,将得到的文件夹复制到 ComfyUI\custom_nodes\

安装依赖包

  • 官方便携包请双击运行插件目录下的install_requirements.bat,秋叶整合包请双击运行插件目录下的install_requirements_aki.bat,然后等待安装完成。

  • 或者在资源管理器ComfyUI\custom_nodes\ComfyUI_LayerStyle_Advance 插件目录位置打开cmd窗口,

  官方便携包输入以下命令:

..\..\..\python_embeded\python.exe -s -m pip install .\whl\docopt-0.6.2-py2.py3-none-any.whl
..\..\..\python_embeded\python.exe -s -m pip install .\whl\hydra_core-1.3.2-py3-none-any.whl
..\..\..\python_embeded\python.exe -s -m pip install -r requirements.txt
.\repair_dependency.bat

  秋叶整合包输入以下命令:

..\..\python\python.exe -s -m pip install .\whl\docopt-0.6.2-py2.py3-none-any.whl
..\..\python\python.exe -s -m pip install .\whl\hydra_core-1.3.2-py3-none-any.whl
..\..\python\python.exe -s -m pip install -r requirements.txt
.\repair_dependency.bat
  • 重新打开ComfyUI。

下载模型

国内用户请从百度网盘, 海外用户请从huggingface, 下载全部模型文件并复制到ComfyUI\models文件夹。这个链接提供了本插件需要的所有的模型文件。 或者按各个节点的说明下载模型文件。
以Ultra命名的节点使用vitmatte模型,请下载vitmatte模型ComfyUI/models/vitmatte文件夹,上面的下载链接也包括了这个模型。

常见问题

如果节点不能正常加载,或者使用中出现错误,请在ComfyUI终端窗口查看报错信息。以下是常见的错误及解决方法。

Warning: xxxx.ini not found, use default xxxx..

这个警告信息是找不到ini文件的提示,不影响使用。如果不想看到这些警告,请修改插件目录下所有的 *.ini.example 文件名为*.ini

ModuleNotFoundError: No module named 'psd_tools'

这个错误是psd_tools没有正确安装。

解决方法:

  • 关闭ComfyUI,在插件目录下打开终端窗口,执行以下命令: ../../../python_embeded/python.exe -s -m pip install psd_tools 如果安装psd_tool中出现ModuleNotFoundError: No module named 'docopt'错误,请下载docopt的whl手动安装。在终端执行以下命令: ../../../python_embeded/python.exe -s -m pip install path/docopt-0.6.2-py2.py3-none-any.whl path为whl文件的路径名。

Cannot import name 'guidedFilter' from 'cv2.ximgproc'

这个错误是opencv-contrib-python没有正确安装,或者安装后又安装了其他opencv包导致。

NameError: name 'guidedFilter' is not defined

问题原因同上。

Cannot import name 'VitMatteImageProcessor' from 'transformers'

这个错误是由于transformers 版本过低造成的

insightface 加载缓慢

这是由于protobuf 版本过低造成的。

以上3个依赖包的问题,请双击运行插件目录下的repair_dependency.bat(官方便携包)或者repair_dependency_aki.bat(秋叶整合包)自动修复。

onnxruntime::python::CreateExecutionProviderInstance CUDA_PATH is set but CUDA wasn't able to be loaded. Please install the correct version of CUDA and cuDNN as mentioned in the GPU requirements page

解决方法: 请重新安装onnxruntime依赖包

Error loading model xxx: We couldn't connect to huggingface.co ...

请检查网络环境。如果在中国不能正常访问huggingface.co,请尝试修改huggingface_hub包强制使用hf_mirror镜像。

  • huggingface_hub包的目录(通常在虚拟环境内的Lib/site-packages/huggingface_hub)中找到constants.py, 在import os之后增加一行
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'

ValueError: Trimap did not contain foreground values (xxxx...)

这个错误是由于使用PyMatting方法处理遮罩边缘时,遮罩面积过大或者过小引起的。

解决方法:

  • 请调整参数,改变遮罩有效面积。或者换用其他的方法处理边缘。

Requests.exceptions.ProxyError: HTTPSConnectionPool(xxxx...)

出现这个错误,请检查网络环境。

UnboundLocalError: local variable 'clip_processor' referenced before assignment

UnboundLocalError: local variable 'text_model' referenced before assignment

如果执行JoyCaption2节点时出现这个报错,同时已确定模型文件已放在正确的目录,请检查transformers依赖包版本至少在4.43.2以上。 如果transformers依赖包版本大于等于4.45.0, 并同时有报错信息:

Error loading models: De️️scriptors cannot be created directly.                                                                                           
If this call came from a _pb2.py file, your generated code is out of date and must be regenerated with protoc >= 3.19.0.                                
......

请尝试降级protobuf依赖包到3.20.3, 或者设置环境变量:PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=python

如何找到本节点组

  • 在ComfyUI画布点击右键 - Add Node, 找到 "😺dzNodes"。
    image

  • 或者在ComfyUI画布双击, 在搜索框输入"layer"。 image

更新说明

**如果本插件更新后出现依赖包错误,请双击运行插件目录下的install_requirements.bat(官方便携包),或 install_requirements_aki.bat(秋叶整合包) 重新安装依赖包。

节点说明

根据图片反推提示词。这个节点是ComfyUI_VLM_nodes中的UForm-Gen2 Qwen Node节点的重新封装,感谢原作者。 从huggingface或者百度网盘下载模型到ComfyUI/models/LLavacheckpoints/files_for_uform_gen2_qwen文件夹。

image

节点选项说明:

  • question: 对UForm-Gen-QWen模型的提示词。

使用Llama 3.2 vision 模型进行本地推理。可以用于生成提示词。本节点部分代码来自ComfyUI-PixtralLlamaMolmoVision,感谢原作者。 运行这个节点需要transformers升级到4.45.0以上。 请从 百度网盘huggingface/SeanScripts下载整个文件夹,并复制到ComfyUI/models/LLM。

image

节点选项说明:
image

  • image: 图片输入。
  • model: 目前仅有"Llama-3.2-11B-Vision-Instruct-nf4"这一个模型可用。
  • system_prompt: LLM模型的系统提示词。
  • user_prompt: LLM模型的用户提示词。
  • max_new_tokens: LLM的max_new_tokens参数。
  • do_sample: LLM的do_sample参数。
  • top-p: LLM的top_p参数。
  • top_k: LLM的top_k参数。
  • stop_strings: 截止字符串。
  • seed: 随机种子。
  • control_after_generate: 种子变化选项。
  • include_prompt_in_output: 输出是否包含提示词。
  • cache_model: 是否缓存模型。

使用JoyCaption-alpha-two模型生成提示词。本节点是 https://huggingface.co/John6666/joy-caption-alpha-two-cli-mod 在ComfyUI中的实现,感谢原作者。 请从 百度网盘 以及 百度网盘 , 或者 huggingface/Orenguteng 以及 huggingface/unsloth 下载整个文件夹,并复制到ComfyUI/models/LLM, 从 百度网盘 或者 huggingface/google 下载整个文件夹,并复制到ComfyUI/models/clip, 从 百度网盘 或者 huggingface/John6666下载 cgrkzexw-599808 文件夹,并复制到ComfyUI/models/Joy_caption。 image

节点选项说明:
image

  • image: 图片输入。
  • extra_options: extra_options参数输入。
  • llm_model: 目前有 Orenguteng/Llama-3.1-8B-Lexi-Uncensored-V2 和 unsloth/Meta-Llama-3.1-8B-Instruct 两种LLM模型可选择。
  • device: 模型加载设备。目前仅支持cuda。
  • dtype: 模型加载精度,有nf4 和 bf16 两个选项。
  • vlm_lora: 是否加载text_model。
  • caption_type: caption类型选项, 包括"Descriptive"(正式语气描述), "Descriptive (Informal)"(非正式语气描述), "Training Prompt"(SD训练描述), "MidJourney"(MJ风格描述), "Booru tag list"(标签列表), "Booru-like tag list"(类标签列表), "Art Critic"(艺术评论), "Product Listing"(产品列表), "Social Media Post"(社交媒体风格)。
  • caption_length: 描述长度。
  • user_prompt: LLM模型的用户提示词。如果这里有内容将覆盖caption_type和extra_options的所有设置。
  • max_new_tokens: LLM的max_new_tokens参数。
  • do_sample: LLM的do_sample参数。
  • top-p: LLM的top_p参数。
  • temperature: LLM的temperature参数。
  • cache_model: 是否缓存模型。

JoyCaption2 的分离式节点,将模型加载与推理分离,使用多个JoyCaption2节点时可共用模型提高效率。

节点选项说明:
image

  • image: 图片输入。
  • joy2_model: JoyCaption模型输入。
  • extra_options: extra_options参数输入。
  • caption_type: caption类型选项, 包括"Descriptive"(正式语气描述), "Descriptive (Informal)"(非正式语气描述), "Training Prompt"(SD训练描述), "MidJourney"(MJ风格描述), "Booru tag list"(标签列表), "Booru-like tag list"(类标签列表), "Art Critic"(艺术评论), "Product Listing"(产品列表), "Social Media Post"(社交媒体风格)。
  • caption_length: 描述长度。
  • user_prompt: LLM模型的用户提示词。如果这里有内容将覆盖caption_type和extra_options的所有设置。
  • max_new_tokens: LLM的max_new_tokens参数。
  • do_sample: LLM的do_sample参数。
  • top-p: LLM的top_p参数。
  • temperature: LLM的temperature参数。

JoyCaption2 的模型加载节点,与JoyCaption2Split配合使用。

节点选项说明:
image

  • llm_model: 目前有 Orenguteng/Llama-3.1-8B-Lexi-Uncensored-V2 和 unsloth/Meta-Llama-3.1-8B-Instruct 两种LLM模型可选择。
  • device: 模型加载设备。目前仅支持cuda。
  • dtype: 模型加载精度,有nf4 和 bf16 两个选项。
  • vlm_lora: 是否加载text_model。

JoyCaption2的extra_options参数节点。

节点选项说明:
image

  • refer_character_name: 如果图像中有人物/角色,必须将其称为{name}
  • exclude_people_info: 不要包含有关无法更改的人物/角色的信息(例如种族、性别等),但仍包含可更改的属性(例如发型)。
  • include_lighting: 包括照明信息。
  • include_camera_angle: 包括摄影机角度信息。
  • include_watermark: 包括是否有水印信息。
  • include_JPEG_artifacts: 包括是否存在 JPEG 伪影信息。
  • include_exif: 如果是照片,包含相机的信息以及光圈、快门速度、ISO等信息。
  • exclude_sexual: 不要包含任何与性有关的内容,保持PG。
  • exclude_image_resolution: 不要包含图像分辨率信息。
  • include_aesthetic_quality: 包含图像美学(从低到非常高)信息。
  • include_composition_style: 包括有关图像构图风格的信息,例如引导线、三分法或对称性。
  • exclude_text: 不要包含任何文字信息。
  • specify_depth_field: 包含景深以及背景模糊信息。
  • specify_lighting_sources: 如果可以判别人造或自然光源,则包含在内。
  • do_not_use_ambiguous_language: 不要使用任何含糊不清的言辞。
  • include_nsfw: 包含NSFW或性暗示信息。
  • only_describe_most_important_elements: 只描述最重要的元素。
  • character_name: 如果选择了refer_character_name,则使用此处的名字。

使用Micrisoft Phi 3.5文字及视觉模型进行本地推理。可以用于生成提示词,加工提示词或者反推图片的提示词。运行这个模型需要至少16GB的显存。 请从百度网盘 或者 huggingface.co/microsoft/Phi-3.5-vision-instructhuggingface.co/microsoft/Phi-3.5-mini-instruct 下载全部模型文件并放到 ComfyUI\models\LLM 文件夹。 image

节点选项说明:
image

  • image: 可选输入。输入的图片将作为Phi-3.5-vision-instruct的输入。
  • model: 可选择加载的Phi-3.5-vision-instruct模型,或者Phi-3.5-mini-instruct模型。默认值auto将根据是否有图片输入自动加载对应模型。
  • device: 模型加载设备。支持cpu和cuda。
  • dtype: 模型加载精度,有fp16、bf16和fp32三个选项。
  • cache_model: 是否缓存模型。
  • system_prompt: Phi-3.5-mini-instruct的系统提示词。
  • user_prompt: LLM模型的用户提示词。
  • do_sample: LLM的do_sample参数,默认为True。
  • temperature: LLM的temperature参数,默认为0.5。
  • max_new_tokens: LLM的max_new_tokens参数,默认为512。

使用Google Gemini API进行文字及视觉模型进行本地推理。可以用于生成提示词,加工提示词或者反推图片的提示词。 请在Google AI Studio申请你的API key, 并将其填到api_key.ini, 这个文件位于插件根目录下, 默认名字是api_key.ini.example, 初次使用这个文件需将文件后缀改为.ini。用文本编辑软件打开,在google_api_key=后面填入你的API key并保存。 image

节点选项说明:
image

  • image_1: 可选输入。如果此处有图片输入,需在user_prompt中说明image_1的用途。
  • image_2: 可选输入。如果此处有图片输入,需在user_prompt中说明image_2的用途。
  • model: 选择Gemini模型。
  • max_output_tokens: Gemini的max_output_tokens参数,默认为4096。
  • temperature: Gemini的temperature参数,默认为0.5。
  • words_limit: 回复字数限制,默认为200。
  • response_language: 回复的语言。
  • system_prompt: 系统提示词。
  • user_prompt: 用户提示词。

使用 SmolLM2 轻量级文本模型进行本地推理。 从百度网盘huggingface 找到 SmolLM2-135M-Instruct、SmolLM2-360M-Instruct、SmolLM2-1.7B-Instruct三个文件夹,至少下载其中之一,复制到 ComfyUI/models/smol文件夹。

image

节点选项说明:
image

  • smolLM2_model: SmolLM2模型输入,从LoadSmolLM2Model 节点加载。
  • max_new_tokens: 最大tokens,默认为512。
  • do_sample: do_sample参数,默认为True。
  • temperature: temperature参数,默认为0.5。
  • top-p: top_p参数,默认0.9。
  • system_prompt: 系统提示词。
  • user_prompt: 用户提示词。

加载 SmolLM2 模型。

节点选项说明:
image

  • model: SmolLM2模型选择,有SmolLM2-135M-Instruct、SmolLM2-360M-Instruct、SmolLM2-1.7B-Instruct三个选项。
  • dtype: 模型精度,有bf16和fp32两个选项。
  • device: 模型加载设备,有cuda和cpu两个选项。

使用 SmolVLM 轻量级视觉模型进行本地推理。 从百度网盘huggingface 下载SmolVLM-Instruct文件夹,复制到 ComfyUI/models/smol文件夹。

image

节点选项说明:
image

  • image: 图片输入,支持批量图片。
  • smolVLM_model: SmolVLM模型输入,从LoadSmolVLMModel 节点加载。
  • max_new_tokens: 最大tokens,默认为512。
  • user_prompt: 用户提示词。

加载 SmolVLM 模型。

节点选项说明:
image

  • model: SmolVLM模型选择,目前仅有SmolVLM-Instruct这一个选择。
  • dtype: 模型精度,有bf16和fp32两个选项。
  • device: 模型加载设备,有cuda和cpu两个选项。

用于生成SD文本到图片提示词的UserPrompt预设。

节点选项说明:
image

  • template: 提示词模板。目前仅有“SD txt2img prompt”可用。
  • describe: 提示词描述。在这里输入简单的描述。
  • limit_word: 输出的提示词最大长度限制。例如200即表示输出文本将被限制在200个词以内。

用于参考输入的内容生成SD文本到图片提示词的UserPrompt预设。

节点选项说明:
image

  • reference_text: 参考文本输入。通常是图片的风格描述。
  • template: 提示词模板。目前仅有“SD txt2img prompt”可用。
  • describe: 提示词描述。在这里输入简单的描述。
  • limit_word: 输出的提示词最大长度限制。例如200即表示输出文本将被限制在200个词以内。

用于将文本中的某个关键词替换为不同内容的UserPrompt预设。这不仅是简单的替换,还可以根据提示词上下文进行文字逻辑梳理以达到输出内容的合理性。

节点选项说明:
image

  • orig_prompt: 原始提示词输入。
  • template: 提示词模板。目前仅有“prompt replace word”可用。
  • exclude_word: 需要排除的关键词。
  • replace_with_word: 替换exclude_word的关键词。

根据图片反推提示词,可以设置替换词。这个节点目前使用Google Gemini API作为后端服务,请确保网络环境可以正常使用Gemini。 请在Google AI Studio申请你的API key, 并将其填到api_key.ini, 这个文件位于插件根目录下, 默认名字是api_key.ini.example, 初次使用这个文件需将文件后缀改为.ini。用文本编辑软件打开,在google_api_key=后面填入你的API key并保存。 image

节点选项说明:
image

  • api: 使用的Api。有"gemini-1.5-flash"和"google-gemini"两个选项。
  • token_limit: 生成提示词的最大token限制。
  • exclude_word: 需要排除的关键词。
  • replace_with_word: 替换exclude_word的关键词。

输入简单的提示词,输出经过润色的提示词,支持输入图片作为参考,支持中文输入。这个节点目前使用Google Gemini API作为后端服务,请确保网络环境可以正常使用Gemini。 请在Google AI Studio申请你的API key, 并将其填到api_key.ini, 这个文件位于插件根目录下, 默认名字是api_key.ini.example, 初次使用这个文件需将文件后缀改为.ini。用文本编辑软件打开,在google_api_key=后面填入你的API key并保存。 image

节点选项说明:
image

  • image: 可选项,输入图像作为提示词参考。
  • api: 使用的Api。有"gemini-1.5-flash"和"google-gemini"两个选项。
  • token_limit: 生成提示词的最大token限制。
  • discribe: 在这里输入简单的描述。支持中文。

使用florence2模型反推提示词。本节点部分的代码来自yiwangsimple/florence_dw,感谢原作者。 *首次使用时将自动下载模型,请在可以访问huggingface.co的网络环境下使用。您也可以从百度网盘下载模型文件并复制到ComfyUI/models/florence2文件夹。

image

节点选项说明: image

  • florence2_model: Florence2模型输入。
  • image: 图片输入。
  • task: 选择florence2任务。
  • text_input: florence2任务文本输入。
  • max_new_tokens: 生成文本的最大token数量。
  • num_beams: 生成文本的beam search数量。
  • do_sample: 是否使用文本生成采样。
  • fill_mask: 是否使用文本标记掩码填充。

从图片中获取主颜色或平均色。 image

节点选项说明: image

  • mode: 模式,有两种可选择,主颜色main_color和平均色average。

输出:

  • RGB color in HEX: 使用16进制RGB字符串格式描述,例如 '#FA3D86'。
  • HSV color in list: HSV颜色值,使用list格式描述。

GetColorTone的V2升级版。可以指定获取主体或背景的主色或平均色。 image image

在GetColorTong基础上做了如下改变: image

  • color_of: 提供4个选项,mask, entire, background和subject, 分别表示选择遮罩区域,整个图片,背景,或主体的颜色。
  • remove_background_method: 背景识别的方法, 有BiRefNet和RMBG V1.4两种可以选择。
  • invert_mask: 是否反转遮罩。
  • mask_grow: 遮罩扩张。对于subject, 更大的值使获得的颜色更接近主体中心的颜色。

输出:

  • image: 纯色图片输出, 尺寸与输入的图片相同。
  • mask: 遮罩输出。

image
对批量图片评分并输出排名靠前的图片。这个节点使用了ImageReward作为图片评分,感谢原作者。

image
节点选项说明:

  • prompt: 可选输入。将prompt在此输入将作为依据判定其与图片的符合程度。
  • output_nun: 输出的图片数量。此数值应小于图片批量。

输出:

  • images: 按评分顺序从高到低输出的批量图片。
  • obsolete_images: 淘汰的图片。同样按评分顺序从高到低输出。

image
根据图像遮罩擦除物体。本节点是对IOPaint的封装,由 SOTA AI 模型提供支持, 感谢原作者。
提供LaMa, LDM, ZITS,MAT, FcF, Manga 模型以及 SPREAD 擦除方法。请查看链接了解各个模型的介绍。
请下载模型文件 lama models(百度网盘) 或者 lama models(Google Drive), 将文件放到ComfyUI/models/lama

节点选项说明: image

  • lama_model: 选择模型或方法。
  • device: 在正确安装torch和Nvidia CUDA驱动程序后,使用cuda将明显提高运行速度。
  • invert_mask: 是否反转遮罩。
  • grow: 遮罩扩张幅度。正值是向外扩张,负值是向内收缩。
  • blur: 遮罩模糊幅度。

image
自动抠图并按照遮罩裁切图片。可指定生成图片的背景颜色、长宽比和大小。这个节点是为生成训练模型的图片素材而设计的。
*请参照 SegmentAnythingUltraRemBgUltra 节点的模型安装方法安装模型。

节点选项说明: image

  • background_color4: 背景颜色。
  • aspect_ratio: 输出的宽高比。这里提供了常见的画幅比例, "custom"为自定义比例。
  • proportional_width: 比例宽。如果aspect_ratio选项不是"custom",此处设置将被忽略。
  • proportional_height: 比例高。如果aspect_ratio选项不是"custom",此处设置将被忽略。
  • scale_by_longest_side: 允许按长边尺寸缩放。
  • longest_side: scale_by_longest_side被设置为True时,此项将作为是图像长边的长度。
  • detect: 探测方法,min_bounding_rect是最小外接矩形, max_inscribed_rect是最大内接矩形。
  • border_reserve: 保留边框。在探测到的遮罩主体区域之外扩展裁切范围。
  • ultra_detail_range: 遮罩边缘超精细处理范围,0为不处理,可以节省生成时间。
  • matting_method: 生成遮罩的方法。有Segment Anything和 RMBG 1.4两种方法。RMBG 1.4运行速度更快。
  • sam_model: 此处选择Segment Anything所使用的sam模型。
  • grounding_dino_model: 此处选择Segment Anything所使用的grounding_dino模型。
  • sam_threshold: Segment Anything的阈值。
  • sam_prompt: Segment Anything的提示词。

输出: cropped_image: 裁切并更换背景后的图像。 box_preview: 裁切位置预览。 cropped_mask: 裁切后的遮罩。

ImageAutoCrop的V2升级版,在之前基础上做了如下改变:
image

  • 增加mask可选输入。当有mask输入时,直接使用该输入跳过内置遮罩生成。
  • 增加fill_background, 当此项设置为False时将不处理背景,并且超出画幅的部分不纳入输出范围。
  • aspect_ratio增加original(原始画面宽高比)选项。
  • scale_by: 允许按长边、短边、宽度或高度指定尺寸缩放。
  • scale_by_length: 这里的数值作为scale_by指定边的长度。

自动裁切图片到指定的尺寸。可输入mask以保留遮罩指定的区域。这个节点是为生成训练模型的图片素材而设计的。

节点选项说明: image

  • image: 输入的图像。
  • mask: 可选输入遮罩。遮罩部分将在裁切长宽比例范围内得到保留。
  • aspect_ratio: 输出的宽高比。这里提供了常见的画幅比例, "custom"为自定义比例, "original"为原始画面比例。
  • proportional_width: 比例宽。如果aspect_ratio选项不是"custom",此处设置将被忽略。
  • proportional_height: 比例高。如果aspect_ratio选项不是"custom",此处设置将被忽略。
  • method: 缩放的采样方法,包括lanczos、bicubic、hamming、bilinear、box和nearest。
  • scale_to_side: 允许按长边、短边、宽度、高度或总像素指定尺寸缩放。
  • scale_to_length: 这里的数值作为scale_to_side指定边的长度, 或者总像素数量(kilo pixels)。
  • round_to_multiple: 倍数取整。例如设置为8,宽和高将强制设置为8的倍数。

输出: cropped_image: 裁切后的图像。 box_preview: 裁切位置预览。

image
增强版的保存图片节点。可自定义保存图片的目录,文件名增加时间戳,选择保存格式,设置图片压缩率,设置是否保存工作流,以及可选给图片添加隐形水印(以肉眼无法觉察的方式添加信息,使用配套的ShowBlindWaterMark节点可以解码水印)。可选择是否同时输出工作流的json文件。

节点选项说明: image

  • iamge: 输入的图片。
  • custom_path*: 用户自定义目录,请按正确的格式输入目录名。如果为空则保存在ComfyUI默认的output目录。
  • filename_prefix*:文件名前缀。。
  • timestamp: 为文件名加上时间戳,可选择日期、时间到秒和时间到毫秒。
  • format:图片保存格式。目前提供png和jpg两种。注意RGBA模式的图片仅支持png格式。
  • quality:图片质量,数值范围10-100,数值越高,图片质量越好,文件的体积也对应增大。
  • meta_data:是否保存元数据即工作流信息到png文件。如果不希望泄露工作流,请把这里设置为false。
  • blind_watermark:这里输入的文字(不支持多语言)将被转换为二维码作为隐形水印保存,使用ShowBlindWaterMark节点可以解码水印。注意有水印的图片建议保存为png格式,质量较低的jpg格式将导致水印信息丢失。
  • save_workflow_as_json: 是否同时输出工作流为json文件(输出的json与图片在同一目录)。
  • preview: 预览开关。

*输入%date表示当前日期(YY-mm-dd),%time表示当前时间(HH-MM-SS)。可以输入/表示子目录。例如%date/name_%time 将输出图片到YY-mm-dd文件夹下,以name_HH-MM-SS为文件名前缀。

image
给图片添加隐形水印。以肉眼无法觉察的方式添加水印图片,使用ShowBlindWaterMark节点可以解码水印。

节点选项说明: image

  • iamge: 输入的图片。
  • watermark_image: 水印图片。这里输入的图片将自动转为正方形的黑白图片作为水印。建议使用二维码作为水印。

AddBlindWaterMarkSaveImagePlus 节点添加的隐形水印解码。 image

生成一个正方形的二维码图片。

节点选项说明:
image

  • size: 生成图片的边长。
  • border: 二维码四周边框的大小,数值越大,边框越宽。
  • text: 这里输入二维码文字内容,不支持多语言。

解码二维码。

节点选项说明:
image

  • image: 输入二维码图片。
  • pre_blur: 预模糊,对难以识别的二维码可以尝试调整此数值。

image
image
加载PSD格式文件,并导出图层。 注意这个节点需要安装psd_tools依赖包,如果安装psd_tool中出现ModuleNotFoundError: No module named 'docopt'错误,请下载docopt的whl手动安装。

节点选项说明:
image

  • image: 这里列出了ComfyUI/input下的*.psd文件,之前加载过的psd图片可以从这里选择。
  • file_path: psd文件的完整路径以及文件名。
  • include_hidden_layer: 是否包括隐藏图层。
  • find_layer_by: 查找图层的方法,可选择按图层索引编号或者图层名称查找。图层组被作为一个图层对待。
  • layer_index: 图层索引编号,0是最下面的图层,依次递增。如果include_hidden_layer设置为false,隐藏的图层不计入。设为-1则输出最上层的图层。
  • layer_name: 图层名称。注意大小写和标点符号必须完全匹配。

输出: flat_image: psd预览图。 layer_iamge: 查找的图层输出。 all_layers: 包含全部图层的批量图片。

image
把SD3的Negative Conditioning 的4个节点封装为一个单独节点。

节点选项说明:
image

  • zero_out_start: 设置Negative ConditioningZeroOut的ConditioningSetTimestepRange start值, 此数值与Negative的ConditioningSetTimestepRange end值相同。

PramaLLC/BEN 项目在ComfyUI中的实现。感谢原作者。
huggingface百度网盘下载BEN_Base.pthconfig.json 两个文件并复制到 ComfyUI/models/BEN文件夹。

image

节点选项说明: image

  • ben_model: Ben模型输入。
  • image: 图片输入。
  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

加载BEN模型。

节点选项说明:
image

  • model: 选择模型。目前仅有Ben_Base 模型可选。

ComfyUI Segment Anything的改进,使遮罩有更具细节的边缘,感谢原作者。 *请参照ComfyUI Segment Anything的安装方法安装模型。如果已经正确安装了ComfyUI Segment Anything,可跳过此步骤。

image
image

节点选项说明:
image

  • sam_model: 选择SAM模型。
  • ground_dino_model: 选择Grounding DINO模型。
  • threshold: SAM阈值。
  • detail_range: 边缘细节范围。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • prompt: SAM的prompt输入。
  • cache_model: 是否缓存模型。

SegmentAnythingUltra的V2升级版,增加了VITMatte边缘处理方法。 image

在SegmentAnythingUltra的基础上做了如下改变:
image

  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

本节点是kijai/ComfyUI-segment-anything-2的改造版本。感谢kijai为ComfyUI社区做出的巨大贡献。
SAM2 Ultra 节点仅支持单张图片,如果需要处理多张图片,请先将image batch 转换为 image list。
*请从百度网盘 或者 huggingface.co/Kijai/sam2-safetensors下载全部模型文件并复制到ComfyUI/models/sam2文件夹。

image

节点选项说明:
image

  • image: 图片输入。
  • bboxes: 识别框数据输入。
  • sam2_model: 选择SAM2模型。
  • presicion: 模型精度,可选择fp16, bf16 和 fp32。
  • bbox_select: 选择输入的框数据。有3个选项:"all"为全部选择,"first"为选择置信度最高的框,"by_index"可以指定框的索引。
  • select_index: 当bbox_select为"by_index"时,此选项有效。0为第一张。可以输入多个值,中间用任意非数字字符分隔,包括不仅限于逗号,句号,分号,空格或者字母,甚至中文。
  • cache_model: 是否缓存模型。缓存模型后将节省模型加载的时间。
  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

SAM2 Video Ultra 节点支持处理多张图片或视频序列帧。请在序列的第一帧定义识别框数据以保证正确识别。

sam2_video_ultra_example.mp4
2024-09-03.152625.mp4

节点选项说明:
image

  • image: 图片输入。
  • bboxes: 可选输入,识别框数据输入。bboxes 和 first_frame_mask 二者必须输入其中之一。如果有first_frame_mask输入,bboxes将被忽略。
  • first_frame_mask: 可选输入遮罩,这里的遮罩将作为首帧识别对象。bboxes 和 first_frame_mask 二者必须输入其中之一。如果有first_frame_mask输入,bboxes将被忽略。
  • pre_mask: 可选输入遮罩,这里的遮罩将作为传播关注范围限制,有助于提高识别准确度。
  • sam2_model: 选择SAM2模型。
  • presicion: 模型精度,可选择fp16, bf16。
  • cache_model: 是否缓存模型。缓存模型后将节省模型加载的时间。
  • individual_object: 当设置为 True时,将专注于识别单一对象。设置为False时,将尝试为多个对象生成识别框。
  • mask_preview_color: 在预览输出中显示非遮罩区域的颜色。
  • detail_method: 边缘处理方法。仅VITMatte可用。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 本节点限制仅使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。更大的尺寸将获得更精细的遮罩边缘,但会导致运算速度明显下降。

使用Gemini API进行物体检测。 请在Google AI Studio申请你的API key, 并将其填到api_key.ini, 这个文件位于插件根目录下, 默认名字是api_key.ini.example, 初次使用这个文件需将文件后缀改为.ini。用文本编辑软件打开,在google_api_key=后面填入你的API key并保存。 image

节点选项说明:
image

  • image: 图片输入。
  • model: Gemini模型。
  • prompt: 描述需要识别的对象。

使用Florence2模型识别图片中的对象,并输出识别框数据。
*请从 百度网盘下载模型文件并复制到ComfyUI/models/florence2文件夹。

节点选项说明:
image

  • image: 图片输入。
  • florence2_model: Florence2模型。从Florence2模型加载器输入。
  • prompt: 描述需要识别的对象。
  • sort_method: 选择框排序方法, 有4个选项:"left_to_right"为从左到右排序,"top_to_bottom"为从上到下排序,"big_to_small"为从大到小排序,"confidence"为按置信度排序。
  • bbox_select: 选择输入的框数据。有3个选项:"all"为全部选择,"first"为选择置信度最高的框,"by_index"可以指定框的索引。
  • select_index: 当bbox_select为"by_index"时,此选项有效。0为第一张。可以输入多个值,中间用任意非数字字符分隔,包括不仅限于逗号,句号,分号,空格或者字母,甚至中文。

ObjectDetectorYOLOWorld (已废弃,如继续使用需要手动安装依赖包)

由于依赖包安装易出问题,已废弃此节点。如需使用,请手动安装下列依赖包:

pip install inference-cli>=0.13.0
pip install inference-gpu[yolo-world]>=0.13.0

使用YOLO World模型识别图片中的对象,并输出识别框数据。
*请从 百度网盘GoogleDrive下载模型文件并复制到ComfyUI/models/yolo-world文件夹。

节点选项说明:
image

  • image: 图片输入。
  • confidence_threshold: 置信度阈值。
  • nms_iou_threshold: 非极大值抑制阈值。
  • prompt: 描述需要识别的对象。
  • sort_method: 选择框排序方法, 有4个选项:"left_to_right"为从左到右排序,"top_to_bottom"为从上到下排序,"big_to_small"为从大到小排序,"confidence"为按置信度排序。
  • bbox_select: 选择输入的框数据。有3个选项:"all"为全部选择,"first"为选择置信度最高的框,"by_index"可以指定框的索引。
  • select_index: 当bbox_select为"by_index"时,此选项有效。0为第一张。可以输入多个值,中间用任意非数字字符分隔,包括不仅限于逗号,句号,分号,空格或者字母,甚至中文。

使用YOLO 8模型识别图片中的对象,并输出识别框数据。
*请在 GoogleDrive 或者 百度网盘 下载模型文件并放到 ComfyUI/models/yolo 文件夹。

节点选项说明:
image

  • image: 图片输入。
  • yolo_model: 选择yolo模型。
  • sort_method: 选择框排序方法, 有4个选项:"left_to_right"为从左到右排序,"top_to_bottom"为从上到下排序,"big_to_small"为从大到小排序,"confidence"为按置信度排序。
  • bbox_select: 选择输入的框数据。有3个选项:"all"为全部选择,"first"为选择置信度最高的框,"by_index"可以指定框的索引。
  • select_index: 当bbox_select为"by_index"时,此选项有效。0为第一张。可以输入多个值,中间用任意非数字字符分隔,包括不仅限于逗号,句号,分号,空格或者字母,甚至中文。

使用遮罩作为识别框数据。遮罩上所有被白色区域包围的区域,将被识别为一个对象。多个封闭区域将各自识别。

节点选项说明:
image

  • object_mask: 遮罩输入。
  • sort_method: 选择框排序方法, 有4个选项:"left_to_right"为从左到右排序,"top_to_bottom"为从上到下排序,"big_to_small"为从大到小排序,"confidence"为默认排序。
  • bbox_select: 选择输入的框数据。有3个选项:"all"为全部选择,"first"为选择置信度最高的框,"by_index"可以指定框的索引。
  • select_index: 当bbox_select为"by_index"时,此选项有效。0为第一张。可以输入多个值,中间用任意非数字字符分隔,包括不仅限于逗号,句号,分号,空格或者字母,甚至中文。

合并识别框数据。

节点选项说明:
image

  • bboxes_1: 必选输入。第一组识别框。
  • bboxes_2: 可选输入。第二组识别框。
  • bboxes_3: 可选输入。第三组识别框。
  • bboxes_4: 可选输入。第四组识别框。

将ObjectDetector节点输出的识别框数据绘制为遮罩。
image

节点选项说明:
image

  • image: 图片输入。必须与ObjectDetector节点识别的图片一致。
  • bboxes: 识别框数据输入。
  • grow_top: 每个识别框向上扩展范围,为识别框高度的百分比。正值为向上扩展,负值为向下扩展。
  • grow_bottom: 每个识别框向下扩展范围,为识别框高度的百分比,正值为向下扩展,负值为向上扩展。
  • grow_left: 每个识别框向左扩展范围,为识别框宽度的百分比。正值为向左扩展,负值为向右扩展。
  • grow_right: 每个识别框向右扩展范围,为识别框宽度的百分比。正值为向右扩展,负值为向左扩展。

DrawBBoxMask 节点基础上增加圆角矩形绘制。
image

新增选项:
image

  • rounded_rect_radius: 圆角矩形半径,范围0-100,数值越大圆角半径越大。
  • anti_alias: 抗锯齿,范围从0-16,数值越大,锯齿越不明显。过高的数值将显著降低节点的处理速度。

本节点是EVF-SAM在ComfyUI中的实现。
*请从百度网盘 或者 huggingface/EVF-SAM2, huggingface/EVF-SAM 下载全部模型文件并复制到ComfyUI/models/EVF-SAM文件夹(请将模型保存在各自子目录中)。

image

节点选项说明:
image

  • image: 图片输入。
  • model: 选择模型。目前有 evf-sam2 和 evf-sam 可选。
  • presicion: 模型精度,可选择fp16, bf16 和 fp32。
  • load_in_bit: 按位精度加载模型。可选择full, 8 和 4。
  • pormpt: 用于分割的提示词。
  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

使用 Florence2 模型的分割功能,同时具有超高的边缘细节。 本节点部分的代码来自spacepxl/ComfyUI-Florence-2,感谢原作者。 *请从 百度网盘下载模型文件并复制到ComfyUI/models/florence2文件夹。

image

节点选项说明:
image

  • florence2_model: Florence2模型输入。
  • image: 图片输入。
  • task: 选择florence2任务。
  • text_input: florence2任务文本输入。
  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

Florence2 模型加载器。 image
目前有 base, base-ft, large, large-ft, DocVQA, SD3-Captioner 和 base-PromptGen模型可以选择。

使用BiRefNet模型去除背景,有更好的识别能力,同时具有超高的边缘细节。 本节点模型部分的代码来自vipery的ComfyUI-BiRefNet,感谢原作者。

*从https://huggingface.co/ViperYX/BiRefNet 或者 百度网盘 下载BiRefNet-ep480.pth,pvt_v2_b2.pth,pvt_v2_b5.pth,swin_base_patch4_window12_384_22kto1k.pth, swin_large_patch4_window12_384_22kto1k.pth5个文件至ComfyUI/models/BiRefNet文件夹。

image

节点选项说明:
image

  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

本节点支持使用最新的BiRefNet模型。
*从百度网盘GoogleDrive 下载 BiRefNet-general-epoch_244.pthComfyUI/Models/BiRefNet/pth 文件夹。也可以下载更多的BiRefNet模型放到这里。

image

节点选项说明:
image

  • image: 图片输入。
  • birefnet_model: BiRefNet模型输入,模型从LoadBiRefNetModel节点输出。
  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 由于BiRefNet的边缘处理已经非常不错,此处默认设为False。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

加载BiRefNet模型。

节点选项说明:
image

  • model: 选择模型。列出 CoomfyUI/models/BiRefNet/pth 文件夹下的文件供选择。

本节点是jimlee2048提交的PR,支持加载RMBG-2.0模型。
huggingface百度网盘 下载全部文件并复制到ComfyUI/models/BiRefNet/RMBG-2.0文件夹。

节点选项说明:
image

  • model: 选择模型。有两个选项: BiRefNet-GeneralRMBG-2.0

使用transparent-background模型去除背景,有更好的识别能力和识别速度,同时具有超高的边缘细节。

*从 googledrive百度网盘 下载全部文件至ComfyUI/models/transparent-background文件夹。

image

节点选项说明:
image

  • model: 选择模型。
  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

为人物生成脸、头发、身体皮肤、衣服或配饰的遮罩。与之前的A Person Mask Generator节点相比,这个节点具有超高的边缘细节。 本节点的模型代码来自a-person-mask-generator,边缘处理代码来自spacepxl的ComfyUI-Image-Filters,感谢原作者。 *从百度网盘 下载模型文件并放到ComfyUI/models/mediapipe文件夹。

image

节点选项说明:
image

  • face: 脸部识别。
  • hair: 头发识别。
  • body: 身体皮肤识别。
  • clothes: 衣服识别。
  • accessories: 配饰(例如背包)识别。
  • background: 背景识别。
  • confidence: 识别阈值,更低的值将输出更多的遮罩范围。
  • detail_range: 边缘细节范围。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。

PersonMaskUltra的V2升级版,增加了VITMatte边缘处理方法。

在PersonMaskUltra的基础上做了如下改变:
image

  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

用于分割人体肢体,是基于metal3d/ComfyUI_Human_Parts 的重新封装,感谢原作者。 本节点在原作基础上增加了超精细边缘处理。请从百度网盘huggingface 下载模型文件并复制到 ComfyUI\models\onnx\human-parts 文件夹。 image

节点选项说明:
image

  • image: 图片输入。
  • face: 是否识别人脸。
  • hair: 是否识别头发。
  • galsses: 是否识别眼镜。
  • top_clothes: 是否识别上装。
  • bottom_clothes: 是否识别下装。
  • torso_skin: 是否识别躯干皮肤。
  • left_arm: 是否识别左手臂。
  • right_arm: 是否识别右手臂。
  • left_leg: 是否识别左腿。
  • right_leg: 是否识别右腿。
  • left_foot: 是否识别左脚。
  • right_foot: 是否识别右脚。
  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

使用YoloV8模型检测人脸、手部box区域,或者人物分割。支持输出所选择数量的通道。 请在 GoogleDrive 或者 百度网盘 下载模型文件并放到 ComfyUI/models/yolo 文件夹。

image

节点选项说明:
image

  • yolo_model: yolo模型选择。带有seg名字的模型可以输出分割的mask, 否则只能输出box区域的遮罩。
  • mask_merge: 选择合并的遮罩。all是合并全部遮罩输出。选数值是输出多少个遮罩,按识别置信度排序合并输出。

输出:

  • mask: 输出的遮罩。
  • yolo_plot_image: yolo识别结果预览图。
  • yolo_masks: yolo识别出来的所有遮罩,每个单独的遮罩输出为一个mask。

使用Mediapipe模型检测人脸五官,分割左右眉、眼睛、嘴唇和牙齿。 *从百度网盘 下载模型文件并放到ComfyUI/models/mediapipe文件夹。

image

节点选项说明:
image

  • left_eye: 左眼识别开关。
  • left_eyebrow: 左眉识别开关。
  • right_eye: 右眼识别开关。
  • right_eyebrow: 右眉识别开关。
  • lips: 嘴唇识别开关。
  • tooth: 牙齿识别开关。

计算两张图像不同之处,并输出为遮罩。 image

节点选项说明:
image

  • gain: 计算增益。调高此值,微弱的差异将更显著的呈现。
  • fix_gap: 修补遮罩内部缝隙。更高的值将修补更大的缝隙。
  • fix_threshold: 修补阈值。
  • main_subject_detect: 此项设为True将开启主体侦测,忽略主体之外的差异。

1 image、mask和background_image(如果有输入)这三项必须是相同的尺寸。

2 mask不是必须的输入项,默认使用image的alpha通道,如果image输入不包含alpha通道将自动创建整个图像的alpha通道。如果输入mask,原本的alpha通道将被mask覆盖。

3 混合模式 包括normal、multply、screen、add、subtract、difference、darker、lighter、color_burn、color_dodge、linear_burn、linear_dodge、overlay、soft_light、hard_light、vivid_light、pin_light、linear_light、hard_mix, 共19种混合模式。
image
*混合模式预览

3 混合模式V2 包括nomal, dissolve, darken, multiply, color burn, linear burn, darker color, lighten, screen, color dodge, linear dodge(add), lighter color, dodge, overlay, soft light, hard light, vivid light, linear light, pin light, hard mix, difference, exclusion, subtract, divide, hue, saturation, color, luminosity, grain extract, grain merge共30种模式。
混合模式V2的部分代码来自Virtuoso Nodes for ComfyUIBlend Modes节点。感谢原作者。 image
*混合模式V2版预览

4 颜色使用16进制RGB字符串格式描述,例如 '#FA3D86'。

5 image和mask这两项必须是相同的尺寸。

Star 记录

Star History Chart

声明

LayerStyle Advance节点遵照MIT开源协议,有部分功能代码和模型来自其他开源项目,感谢原作者。如果作为商业用途,请查阅原项目授权协议使用。