图像分类的工作原理 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

图像分类的工作原理

图像分类算法将图像作为输入,并将其归入输出类别之一。深度学习彻底改变了图像分类域,并且表现非常出色。已经开发出各种深度学习网络 ResNet,例如DenseNet Inception 等,这些网络对于图像分类具有很高的准确性。与此同时,我们一直在努力收集对训练这些网络非常必要的标签图像数据。ImageNet就是这样一个庞大的数据集,包含超过 1100 万张图像,大约有 11,000 个类别。使用 ImageNet 数据训练网络后,通过简单的重新调整或微调,也可以将其与其他数据集一起进行泛化。在这种迁移学习方法中,使用权重初始化网络(在本例中,使用权重进行训练 ImageNet),稍后可以针对不同数据集中的图像分类任务对其进行微调。

Amazon 中的图像分类 SageMaker 可以通过两种模式运行:完整训练和迁移学习。在完整训练模式下,网络使用随机权重进行初始化,并从头开始根据用户数据进行训练。在迁移学习模式下,网络使用预先训练的权重进行初始化,并且只有顶部完全连接的层使用随机权重进行初始化。然后,使用新数据对整个网络进行微调。在此模式下,甚至可以使用较小数据集实现训练。这是因为网络已经过训练,因此可在训练数据不足的情况下使用。