在互联网免费模式下运行训练和推理容器 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

在互联网免费模式下运行训练和推理容器

SageMaker 训练和部署的推理容器默认情况下启用互联网。这允许容器访问外部服务和公共 Internet 上的资源,以作为训练和部署工作负载的一部分。不过,这为未经授权访问您的数据提供了一种途径。例如,恶意用户或无意中安装在容器上的恶意代码(以公开发布的源代码库形式)就可以访问您的数据并将数据传输到远程主机。

如果您在调用 CreateTrainingJobCreateHyperParameterTuningJobCreateModel 时,通过为 VpcConfig 参数指定值来使用 Amazon VPC,则可以通过管理安全组和限制从您的 VPC 访问互联网来保护您的数据和资源。但是,其代价是进行额外网络配置的成本,并且配置网络时有出错的风险。如果您不希望 SageMaker 为训练或推理容器提供外部网络访问权限,则可以启用网络隔离。

网络隔离

您可以在创建训练作业或模型时启用网络隔离,方法是在调用 CreateTrainingJobCreateHyperParameterTuningJobCreateModel 时将 EnableNetworkIsolation 参数的值设置为 True

注意

使用来自 Amazon Web Services Marketplace 的资源运行训练作业和模型时需要网络隔离。

如果您启用网络隔离,则容器无法进行任何出站网络调用,甚至对于其他 Amazon 服务(如 Amazon S3)也是如此。此外,没有任何 Amazon 凭证可用于容器运行时环境。对于包含多个实例的训练作业,网络入站和出站流量仅限于每个训练容器的对等节点。SageMaker 仍然使用您的 SageMaker 执行角色对 Amazon S3 执行下载和上传操作,与训练或推理容器隔离开来。

以下托管 SageMaker 容器不支持网络隔离,因为它们需要访问 Amazon S3:

  • Chainer

  • SageMaker 强化学习

使用 VPC 进行网络隔离

网络隔离可与 VPC 结合使用。在这种情况下,下载和上传的客户数据和模型构件将通过您的 VPC 子网进行路由。但是,训练和推理容器本身继续与网络隔离,并且对 VPC 内或 Internet 上的任何资源都没有访问权限。