实时目标检测-自动驾驶领域
检测自动驾驶场景图片的目标,支持车辆检测。
  • 模型资讯
  • 模型资料

通用实时检测模型

实时目标检测-自动驾驶领域模型是专注于自动驾驶场景的目标检测模型。

模型描述

YOLOX-PAI是阿里云机器学习平台PAI的开源计算机视觉代码库EasyCV中集成的YOLOX算法, 提供快速、精确的目标检测能力。本模型为YOLOX-PAI的小规模模型,使用了RepVGG结构作为backbone,ASFF作为neck,TOOD作为head,基于公开数据集Waymo、BDD100K、Nuimage100K训练,目前支持车辆目标检测。

下图为检测效果样例图:

期望模型使用方式以及适用范围

  • 自动驾驶场景目标定位与识别。
  • 自动驾驶场景车辆粗略计数。
  • 作为其他自动驾驶场景算法的前置算法,如跟踪算法等。

如何使用

在ModelScope框架上,可以通过ModelScope的pipeline进行调用.

代码范例

# numpy >= 1.20
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
from modelscope.outputs import OutputKeys

realtime_detector = pipeline(Tasks.image_object_detection, model='damo/cv_yolox_image-object-detection-auto')
result = realtime_detector('https://modelscope.oss-cn-beijing.aliyuncs.com/test/images/auto_demo.jpg')
# print predicted results, including scores, labels, boxes
print(result)

模型局限性以及可能的偏差

  • 对于尺寸特别小的车辆和行人可能会存在检出效果不佳的情况,建议对过小检出目标的进行限制。
  • 目前模型仅限于pipeline调用,尚未支持Finetune和Evaluation。
  • 非自动驾驶场景性能会产生显著下降,如监控场景、无人机视角场景等。
  • 当前版本在python 3.7环境测试通过,其他环境下可用性待测试。

训练数据介绍

本模型基于Waymo、Nuimage100K、BDD100K数据集中所有包含车辆的目标检测训练集图片及标注进行训练。

模型训练流程

模型在线训练暂不支持。部分关键训练细节如下:

  • 使用 SGD 优化算法,cos LR scheduler,warmup策略。
  • 训练迭代为 300 epoch,其中最后15个epoch关闭数据增强。
  • Mosaic,颜色增强等策略被应用到训练预处理中。

输入预处理

  • 输入图像根据长边resize到640后,padding 为640x640的矩形进行推理
  • 图像归一化

数据评估及结果

Model size mAPval
0.5:0.95
Speed V100
(ms) fp16 bs32
Params
(M)
FLOPs
(G)
YOLOX-PAI 640 43.9 1.15 23.7 49.9

引用

如您的相关著作、作品使用了该模型,请引用以下信息:

@article{zou2022yolox,
  title={YOLOX-PAI: An Improved YOLOX Version by PAI},
  author={Zou, Xinyi and Wu, Ziheng and Zhou, Wenmeng and Huang, Jun},
  journal={arXiv preprint arXiv:2208.13040},
  year={2022}
}