图像分类的工作原理 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

图像分类的工作原理

图像分类算法将图像作为输入,并将其归入输出类别之一。深度学习彻底改变了图像分类域,并且表现非常出色。各种深度学习网络(如 ResNet [1]、DenseNet、Inception 等)的开发均旨在实现高度准确的图像分类。与此同时,我们一直在努力收集对训练这些网络非常必要的标签图像数据。ImageNet [2] 是具有超过 1,100 万个图像和大约 11,000 个类别的此类大型数据集。使用 ImageNet 数据训练网络后,它可以用于通过其他数据集通过简单的重新调整或优化进行泛化。在这种迁移学习方法中,网络使用权重进行初始化(在本示例中,在 ImageNet 上训练),稍后可针对不同数据集中的图像分类任务对其进行优化。

Amazon SageMaker 中的图像分类可在两种模式下运行:完整训练和迁移学习。在完整训练模式下,网络使用随机权重进行初始化,并从头开始根据用户数据进行训练。在迁移学习模式下,网络使用预先训练的权重进行初始化,并且只有顶部完全连接的层使用随机权重进行初始化。然后,使用新数据对整个网络进行微调。在此模式下,甚至可以使用较小数据集实现训练。这是因为网络已经过训练,因此可在训练数据不足的情况下使用。