Skip to content

lenML/comfyui_qwen_image_edit_adv

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Qwen Image Edit Adv - ComfyUI Nodes

这里提供了改进后的 Qwen Image Edit 相关自定义节点,主要目标是修复 ComfyUI 内置节点导致的编辑结果偏移问题,并提供更灵活的缩放和裁剪逻辑。

主要节点:

  • TextEncodeQwenImageEditAdv: 仅负责编码图片和 prompt,不进行缩放
  • QwenImageEditScale: 提供灵活可控的缩放和裁剪逻辑,满足 Qwen Image Edit 模型需求
  • QwenImageEditSimpleScale: 自动选择最合适的分辨率进行缩放的简化版
image

在对比测试中,可以看到本实现不会出现偏移问题,且无需多次抽卡生成。


背景

ComfyUI 内置的 TextEncodeQwenImageEdit 节点包含了强绑定的缩放逻辑,但该缩放方式与 Qwen Image Edit 模型官方要求并不完全一致,且难以调试。 因此,本仓库将 缩放编码 分离开,并提供更合理的缩放策略,方便测试和调优。

你可以使用 ./workflows/demo_compare.json 工作流快速对比官方流程与本节点输出结果,并通过 comparer 查看一致性。


节点与参数说明

1. TextEncodeQwenImageEditAdv

image

作用与内置的 TextEncodeQwenImageEdit 基本一致:

  • 输入 clipprompt,可选 vaeimage
  • 输出 conditioninglatent
  • 不包含任何缩放逻辑,更透明可控

2. QwenImageEditScale

image

提供高度可配置的缩放与裁剪逻辑。

参数说明:

  • upscale_method: 缩放方法(area/bicubic/bilinear/nearest-exact/lanczos),一般无需修改

  • ratio_strategy: 长宽比处理策略

    • disabled: 不处理比例
    • closest: 自动裁剪为最接近的官方允许比例
    • W:H: 固定裁剪到指定比例(如 3:2
  • target_megapixels:

    • 控制缩放后的总像素量
    • 默认 1.0 → 接近 1024x1024
    • 可调节范围 0.3M ~ 1.4M,推荐值:10.650.950.92
    • 越大 → 模型自由度更高,越容易不严格遵循 prompt
    • 越小 → 一致性更强,不容易偏移
  • alignment: 尺寸对齐的步长(默认 32,官方训练使用值),推荐值:321656148

返回结果:

  • IMAGE: 缩放后的图像
  • width / height: 实际输出分辨率
  • ratio: 裁剪后的比例字符串(如 3:2

3. QwenImageEditSimpleScale

image

QwenImageEditScale 的简化版:

  • 自动根据输入尺寸选择最合适的缩放比例

  • 保证分辨率落在 Qwen Image Edit 可接受范围 (1M pixels)

  • 仅需设置:

    • resolution: 分辨率(默认 1024) 几乎不需要改,这个是由模型训练导致的几乎只有 1024 分辨率可以正常使用
    • aligment: 对齐步长(默认 32) 几乎不需要改,如果你想尝试修改推荐: 32 56 16 8

适用场景:

  • 一般使用推荐 QwenImageEditSimpleScale
  • 需要手动调试时使用 QwenImageEditScale
  • 甚至,你可以不使用本包的缩放节点,你完全可以用其他 resize 节点来缩放图片,但是需要你更多的调试

LoRA 推荐

结合以下 LoRA 使用,可以进一步提升一致性和低分辨率效果:

About

Improved qwen image editing accuracy

Resources

License

Stars

Watchers

Forks

Languages