针对长尾/小目标问题的高性能通用目标检测
  • 模型资讯
  • 模型资料

abnormal-object-detection模型介绍

主要是针对长尾和小目标问题解决的高性能通用目标检测模型,采用COCO数据集训练。本模型基于Resnet50-Backbone增加可形变卷积等模块增强多角度单目标识别的精度;在Neck、RPN-head和ROI-head针对长尾和小目标问题进行了模型优化,以适用特定场景下痛点问题的解决。

期望模型使用方式与适用范围

本模型适用范围较广,能对图片中包含的大部分前景物体(COCO 80类)进行定位。

如何使用

在ModelScope框架上,提供输入图片,即可以通过简单的Pipeline调用使用当前模型。暂不支持cpu。

代码范例

from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
object_detect = pipeline(Tasks.image_object_detection,model='damo/cv_resnet50_object-detection_maskscoring')
img_path ='https://modelscope.oss-cn-beijing.aliyuncs.com/test/images/image_detection.jpg'
result = object_detect(img_path)
print(result)

模型局限性以及可能的偏差

  • 模型采用COCO2017数据集训练和评估测试,对于其它特定工业场景数据建议加入数据微调。
  • 针对小目标识别漏检情况,建议将原始大分辨率图片进行切割成若干小图进行训练和预测。
  • 目前模型仅限于pipeline调用,尚未支持Finetune和Evaluation。

训练数据介绍

  • coco2017数据集,Microsoft团队提供的一个可以用来图像识别、检测和分割的数据集。COCO2017包含训练集118287张、验证集5000张、测试集40670张,共有80类物体。具体可见(https://cocodataset.org/#detection-2017)

模型训练流程

  • 模型在线训练暂不支持。部分关键训练细节如下:
    使用ImageNet-1K上的预训练模型Resnet50作为基础backbone,基于MaskScoringRCNN结构优化。

预处理

  • 给定一张输入图像,分辨率归一化至(1333, 800),颜色值减均值除方差归一化处理。

数据评估及结果

Backbone Pretrain Box mAP_s Remark Log
R-50-FPN ImageNet-1k 22.9 MaskRCNN log
R-50-FPN ImageNet-1k 21.7 MaskScoringRCNN log
R-50-FPN-BFP ImageNet-1k 27.8 modelscope log

引用

@article{He_2017,
   title={Mask R-CNN},
   journal={2017 IEEE International Conference on Computer Vision (ICCV)},
   publisher={IEEE},
   author={He, Kaiming and Gkioxari, Georgia and Dollar, Piotr and Girshick, Ross},
   year={2017},
   month={Oct}
}
@inproceedings{huang2019msrcnn,
    title={Mask Scoring R-CNN},
    author={Zhaojin Huang and Lichao Huang and Yongchao Gong and Chang Huang and Xinggang Wang},
    booktitle={IEEE Conference on Computer Vision and Pattern Recognition},
    year={2019},
}