三井绘蓝 Mitsua Diffusion CC0
三井绘蓝 Mitsua Diffusion CC0 是一个基于隐空间的文生图模型,它的UNet完全从零开始训练,使用的数据是公开的、CC0的或是允许使用的版权图片。
文本编码器和VAE来自Stable Diffusion v2.1 base.
该模型将作为 AI 虚拟偶像三井绘蓝 AI VTuber Elan Mitsua🖌️的基础模型。
❗❗ 目前该模型的生成质量和多样性还比较差强人意 ❗❗
目前生成图像的质量还不是很好。大部分现代画风无法表现出来。但是该模型是一个很好的出发点,且仍在以合法的方式迭代改进中。
加入三井绘蓝的推特并支持她吧!🎉
我们采用了邀请制来进行进一步的训练。如果你感兴趣,请点击这里提交申请。
我们对加入训练的人员创建了一个Discord群组。目前群内的讨论都以日语进行。
点击此处查看所有prompts.
Training Data Sources
训练数据来源
所有数据均在遵守网站条款和条件的道德标准下获得。
未经许可,此模型的训练中不使用任何版权图片。
数据集中不包含任何由AI生成的图像。
- Traditional Artwork in public domain / CC0
- MET Museum Open Access
- Smithsonian Open Access
- Cleveland Museum of Art Open Access
- National Gallery of Art Open Access
- ArtBench-10 (public domain subset)
- CC0 Photos
- Flickr, Wikimedia Commons
- CC0 NFTs *1
- goblintown.nft, mfer, tubby-cats, Timeless
- CC0 VRM models
- made by VRoid Project, pastelkies, yomox9 (all CC0 subset)
- We generated a bunch of synthesized images dataset rendered with various poses and camera angles.
- Copyright images with permission for use
- Generative and Visual Artworks made by Rhizomatiks
数据量大约为1100万,训练时加上了数据增广。
- 他们的作品采用CC0许可证发布,但如果您考虑使用此模型创建受他们NFT启发的作品并将其作为NFT出售,请考虑支付版税以帮助CC0 NFT社区发展。
使用方法
from modelscope.utils.constant import Tasks
from modelscope.pipelines import pipeline
import cv2
pipe = pipeline(task=Tasks.text_to_image_synthesis,
model='dienstag/mitsua-diffusion-cc0',
model_revision='v0.1')
prompt = "woman portrait, a renaissance painting"
output = pipe({'text': prompt})
cv2.imwrite('result.png', output['output_imgs'][0])
License
Creative Open-Rail+±M License
❗❗ “Mitsua Diffusion CC0”的意思是大部分训练数据的许可证是CC0. 模型许可证本身不是CC0.❗❗
这个模型是开放的,所有人都可以使用,CreativeML OpenRAIL-M许可证进一步规定了权利和使用。CreativeML OpenRAIL许可证规定了:
- 你不能使用这个模型来故意产生或分享非法或有害的输出或内容。
- 作者对你产生的输出结果没有任何权利,你可以自由使用它们,并对它们的使用负责,但不得违反许可证中的规定。
- 你可以重新发布模型权重,并在商业上作为一项服务使用该模型。如果你这样做,请注意你必须包括与许可证中相同的使用限制,并将CreativeML OpenRAIL-M的副本分享给你的所有用户(请完全仔细阅读许可证)。 请在这里阅读完整的许可证。
鸣谢
- Stable Diffusion 2.1: Robin Rombach, Patrick Esser
- Mitsua Diffusion CC0 : Abstract Engine dev team