图像分类的工作原理 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

图像分类的工作原理

图像分类算法将图像作为输入,并将其归入输出类别之一。深度学习彻底改变了图像分类域,并且表现非常出色。各种深度学习网络 (如 ResNet [1]、DenseNet、Inception 等) 的开发均旨在实现高度准确的图像分类。与此同时,我们一直在努力收集对训练这些网络非常必要的标签图像数据。ImageNet[2] 便是这样一种大型数据集,它拥有大约 11,000 种类别和超过 1,100 万张图像。一旦网络接受了培训 ImageNet 然后,该数据集可用于通过简单的重新调整或微调进行泛化。在这种迁移学习方法中,网络通过权重进行初始化(对于本例,在 ImageNet 上进行训练),稍后可针对不同数据集中的图像分类任务进行优化。

Amazon 中的图像分类 SageMaker 可在两种模式下运行:完整训练和迁移学习。在完整训练模式下,网络使用随机权重进行初始化,并从头开始根据用户数据进行训练。在迁移学习模式下,网络使用预先训练的权重进行初始化,并且只有顶部完全连接的层使用随机权重进行初始化。然后,使用新数据对整个网络进行微调。在此模式下,甚至可以使用较小数据集实现训练。这是因为网络已经过训练,因此可在训练数据不足的情况下使用。