在 Internet 免费模式下运行的训练和推理容器 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 Internet 免费模式下运行的训练和推理容器

SageMaker 训练和部署的推理容器默认情况下启用 Internet。这允许容器访问外部服务和公共 Internet 上的资源,以作为训练和部署工作负载的一部分。但是,这可能提供了一个未经授权访问您的数据的途径。例如,恶意用户或无意中安装在容器上的恶意代码(以公开发布的源代码库形式)就可以访问您的数据并将数据传输到远程主机。

如果您在调用 Amazon VPC VpcConfig CreateTrainingJob CreateHyperParameterTuningJob 时通过为 CreateModel 参数指定值来使用 ,则可以通过管理安全组并限制从 VPC 访问 Internet 来保护您的数据和资源。但是,其代价是进行额外网络配置的成本,并且配置网络时有出错的风险。如果您不希望 SageMaker 提供对训练或推理容器的外部网络访问权限,您可以在创建训练作业或模型时启用网络隔离,方法是在调用 EnableNetworkIsolation True CreateTrainingJob CreateHyperParameterTuningJob 时,将 参数的值设置为 CreateModel

如果您启用网络隔离,则容器无法进行任何出站网络调用,甚至对于其他 AWS 服务(如 Amazon S3)也是如此。此外,没有任何 AWS 凭证可用于容器运行时环境。对于具有多个实例的训练作业,网络入站和出站流量限制为每个训练容器的对等项。SageMaker 仍使用与训练或推理容器隔离的 Amazon S3 执行角色针对 SageMaker 执行下载和上传操作。

网络隔离是使用来自 AWS Marketplace 的资源运行的训练作业和模型所必需的。网络隔离可与 VPC 结合使用。在这种情况下,下载和上传的客户数据和模型构件将通过您的 VPC 子网进行路由。但是,训练和推理容器本身继续与网络隔离,并且对 VPC 内或 Internet 上的任何资源都没有访问权限。

以下托管 SageMaker 容器不支持网络隔离,因为它们需要访问 Amazon S3:

  • Chainer

  • PyTorch

  • Scikit-learn

  • SageMaker 强化学习