稳定调用及效果更好的API,详见视觉开放智能平台:图片智能鉴黄。
内容审核模型-鉴黄
模型(项目地址)采用resnet50作为backbone,训练数据集为NSFW,本模型使用去噪后的大约250k训练数据(40g左右),训练集包含五类标签,分别为pornography images,hentai images and pornographic drawings,sexually explicit images, safe for work neutral images,safe for work drawings and anime。其中sexually explicit images认为是不合规的内容,其余均为合规内容。
本模型可以用来判断图片中的内容是否涉黄,分数越高则不涉黄的可能性越高。
鉴黄模型是贯彻《互联网信息服务管理办法》、促进网络环境绿色健康化发展以及降低人力成本,提升鉴黄效率的一项重要举措。鉴黄模型可以使用在大型网站服务器、各类图片云服务器以及其他支持图片存储的社交应用、垂直社区等UGC 平台上,这些平台都需要对用户上传的图像内容进行审核。
测试时主要的预处理如下:
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
content_check_func = pipeline(Tasks.image_classification, 'damo/cv_resnet50_image-classification_cc')
img_path = 'https://modelscope.oss-cn-beijing.aliyuncs.com/test/images/content_check.jpg'
result = content_check_func(img_path)
print(f'content check output: {result}.')
本模型及代码来自第三方开源技术(项目地址)。