本模型自 Stable Diffusion 1.5 微调而来,微调数据来自某著名动画工作室的电影截图。在 prompt 中加入 modern disney style
可以在生成图像中实现该效果。
一些生成效果图:
Lara Croft对应的 prompt 和设置:
modern disney lara croft
Steps: 50, Sampler: Euler a, CFG scale: 7, Seed: 3940025417, Size: 512x768
狮子王对应的 prompt 和设置:
**modern disney (baby lion) **
Negative prompt: person human
Steps: 50, Sampler: Euler a, CFG scale: 7, Seed: 1355059992, Size: 512x512
该模型使用diffusers自带的dreambooth样例代码(作者ShivamShrirao)训练9000个step而来。训练过程中使用了prior-preservation loss 和 train-text-encoder 选项。
from modelscope.utils.constant import Tasks
from modelscope.pipelines import pipeline
import cv2
pipe = pipeline(task=Tasks.text_to_image_synthesis,
model='dienstag/mo-di-diffusion',
model_revision='v1.0.1')
prompt = 'a magical princess with golden hair, modern disney style'
output = pipe({'text': prompt})
cv2.imwrite('result.png', output['output_imgs'][0])
这个模型是开放的,所有人都可以使用,CreativeML OpenRAIL-M许可证进一步规定了权利和使用。CreativeML OpenRAIL许可证规定了: