对象检测的工作原理 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

对象检测的工作原理

对象检测算法根据已知的对象类别集合来识别和定位图像中的对象的所有实例。该算法接受图像作为输入并输出对象所属的类别,以及它属于该类别的置信度分数。该算法还使用矩形边界框预测对象的位置和比例。Amazon SageMaker 对象检测使用单张图片多方框检测器 (SSD) 算法,该算法采用卷积神经网络 (CNN) 作为基础网络用于分类任务预训练。SSD 使用中间层输出作为检测特征。

各种 CNN(例如 VGGResNet)在图像分类任务上都有很好的表现。Amazon SageMaker 中的对象检测支持使用 VGG-16 和 ResNet-50 作为基础网络用于 SSD。该算法可以在完全训练模式或迁移学习模式中训练。在完全训练模式下,基础网络使用随机权重进行初始化,然后根据用户数据进行训练。在迁移学习模式下,基础网络和权重是从预训练模型加载的。

对象检测算法在内部动态使用标准数据扩增操作,例如翻转、重新调整和抖动,以帮助避免过度拟合。