给定一张单个人物图像(半身或全身),无需任何额外输入,端到端地实现对人物身体区域(肩部,腰部,腿部等)的自动化美型处理。相关论文发表在CVPR2022上。
其生成效果如下所示:
该任务借助于人体姿态识别模型提取的骨骼结构信息,对输入图像提取与结构耦合的深度特征,预测出光流形变场,并映射回原始图像,最终实现了业内首个端到端的自适应美型功能。
使用方式:
使用范围:
目标场景:
在ModelScope框架上,提供输入图片,即可以通过简单的Pipeline调用来使用。
import cv2
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
image_body_reshaping = pipeline(Tasks.image_body_reshaping,
model='damo/cv_flow-based-body-reshaping_damo')
image_path = 'https://modelscope.oss-cn-beijing.aliyuncs.com/test/images/image_body_reshaping.jpg'
result = image_body_reshaping(image_path)
cv2.imwrite('result.png', result[OutputKeys.OUTPUT_IMG])
print('finished!')
模型训练数据有限,部分非常规人体图像或者人体在图像中占比过小可能会影响美型效果。
少数复杂姿态和被遮挡的人体图像会无法准确检测出骨骼信息,从而影响到最终美型效果。
使用BR-5K数据集进行评测,在SSIM/PSNR/LPIPS/用户偏好等指标上均达SOTA结果。
Method | SSIM | PSNR | LPIPS | User Preference |
---|---|---|---|---|
Origin | 0.8339 | 24.4916 | 0.0823 | N.A. |
FAL | 0.8261 | 24.1841 | 0.0837 | 14.4% |
ATW | 0.8316 | 24.6332 | 0.0805 | 9.8% |
pix2pixHD | 0.7271 | 21.8381 | 0.2800 | 3.6% |
GFLA | 0.6649 | 21.4796 | 0.6136 | 1.8% |
Ours | 0.8354 | 24.7924 | 0.0777 | 70.4% |
如果该模型对你有所帮助,请考虑引用如下相关论文:
@inproceedings{ren2022structure,
title={Structure-Aware Flow Generation for Human Body Reshaping},
author={Ren, Jianqiang and Yao, Yuan and Lei, Biwen and Cui, Miaomiao and Xie, Xuansong},
booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR2022)},
pages={7754--7763},
year={2022}
}