适用于深度学习实例的 Amazon ECS 任务定义
要在 Amazon ECS 上使用深度学习工作负载,请将 Amazon EC2 DL1
注意事项
在 Amazon ECS 上开始部署 DL1 之前,请注意以下事项:
-
您的集群可以包含 DL1 和非 DL1 实例的组合。
-
在创建服务或运行独立任务时,您可以在配置任务放置约束时使用实例类型属性,以确保在您指定的容器实例上启动任务。这样做可以确保您有效地使用资源,并确保深度学习工作负载任务在 DL1 实例上。有关更多信息,请参阅 Amazon ECS 如何将任务放置在容器实例上。
以下示例运行
default
集群上的dl1.24xlarge
实例任务。aws ecs run-task \ --cluster default \ --task-definition ecs-dl1-task-def \ --placement-constraints type=memberOf,expression="attribute:ecs.instance-type == dl1.24xlarge"
使用 DL1 AMI
您有三种选择可以在 Amazon EC2 DL1 实例上运行适用于 Amazon ECS 的 AMI:
-
Habana 在此处
提供的 Amazon Web Services Marketplace AMI。 -
Amazon Web Services 提供的 Habana 深度学习 AMI。因为它不包括在内,因此您需要单独安装 Amazon ECS 容器代理。
-
使用 Packer 构建由 GitHub 存储库
提供的自定义 AMI。有关更多信息,请参阅 Packer 文档 。