Skip to content

关于输入图像维度的问题 #9

@littlewater3

Description

@littlewater3

看到有说明输入的图像需要转化为512512维度的图像。
我有大概数千张32
32的带类别标签的图像,如何采用这些图像去重新训练stable diffusion model?
需要缩放为512512吗?还是说有办法拿这些3232的图像直接去训练。
如果去训练改模型,vae、unet、text encoder这些权重哪些需要改变?
我是刚入门的小白,望大佬指教

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions