对象检测的工作原理 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

对象检测的工作原理

对象检测算法根据已知的对象类别集合来识别和定位图像中的对象的所有实例。该算法接受图像作为输入并输出对象所属的类别,以及它属于该类别的置信度分数。该算法还使用矩形边界框预测对象的位置和比例。Amazon SageMaker对象检测使用 Single Shot multibox Detector (SSD) (单张图片多方框检测器 (SSD)) 算法,该算法采用卷积神经网络 (CNN) 作为基础网络,预先训练用于分类任务。SSD 使用中间层输出作为检测特征。

各种 CNNs(如 VGGResNet)在图像分类任务上都具有很好的性能。中的对象检测支持将 VGG-16 和 Amazon SageMaker-50 作为 SSD 基础网络。ResNet该算法可以在完全训练模式或迁移学习模式中训练。在完全训练模式下,基础网络使用随机权重进行初始化,然后根据用户数据进行训练。在迁移学习模式下,基础网络和权重是从预训练模型加载的。

对象检测算法在内部动态使用标准数据扩增操作,例如翻转、重新调整和抖动,以帮助避免过度拟合。