awsbsub - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

awsbsub

向集群的作业队列提交作业。

awsbsub [-h] [-jn JOB_NAME] [-c CLUSTER] [-cf] [-w WORKING_DIR] [-pw PARENT_WORKING_DIR] [-if INPUT_FILE] [-p VCPUS] [-m MEMORY] [-e ENV] [-eb ENV_DENYLIST] [-r RETRY_ATTEMPTS] [-t TIMEOUT] [-n NODES] [-a ARRAY_SIZE] [-d DEPENDS_ON] [command] [arguments [arguments ...]]
重要

Amazon ParallelCluster 不支持以下GPU方面的工作 Amazon Batch。有关更多信息,请参阅GPU作业

定位参数

command

提交作业(指定的命令必须在计算实例上可用),或指定要传输的文件名。另请参阅 --command-file

arguments

(可选)指定命令或命令文件的参数。

命名的参数

-jn JOB_NAME, --job-name JOB_NAME

为作业命名。第一个字符必须是字母或数字。作业名称可以包含字母(大写和小写)、数字、连字符和下划线,长度不超过 128 个字符。

-c CLUSTER, --cluster CLUSTER

指定要使用的集群。

-cf, --command-file

指示命令是要传输到计算实例的文件。

默认值:False

-w WORKING_DIR, --working-dir WORKING_DIR

指定要用作作业的工作目录的文件夹。如果未指定工作目录,则在用户的主目录的 job-<AWS_BATCH_JOB_ID> 子文件夹中运行作业。您可以使用此参数或 --parent-working-dir 参数。

-pw PARENT_WORKING_DIR, --parent-working-dir PARENT_WORKING_DIR

指定作业的工作目录的父文件夹。如果未指定父工作目录,则默认为用户的主目录。在父工作目录中创建名为 job-<AWS_BATCH_JOB_ID> 的子文件夹。您可以使用此参数或 --working-dir 参数。

-if INPUT_FILE, --input-file INPUT_FILE

指定要传输到计算实例的文件(在作业的工作目录中)。您可以指定多个输入文件参数。

-p VCPUS, --vcpus VCPUS

指定要为容器保留的数量。 vCPUs 与一起使用时–nodes,它会标识每个节点 vCPUs 的数量。

默认值:1

-m MEMORY, --memory MEMORY

指定要为作业提供的内存的硬限制(以 MiB 为单位)。如果您的作业尝试超出此处指定的内存限制,则该作业将被结束。

默认值:128

-e ENV, --env ENV

指定要导出到作业环境的环境变量名称的逗号分隔的列表。要导出所有环境变量,请指定“all”。请注意,“all”环境变量列表不包含 –env-blacklist 参数中列出的环境变量,或以 PCLUSTER_*AWS_* 前缀开头的环境变量。

-eb ENV_DENYLIST, --env-blacklist ENV_DENYLIST

指定会导出到作业环境的环境变量名称的逗号分隔的列表。默认情况下,不会导出 HOMEPWDUSERPATHLD_LIBRARY_PATHTERMTERMCAP

-r RETRY_ATTEMPTS, --retry-attempts RETRY_ATTEMPTS

指定要让作业进入 RUNNABLE 状态的次数。可以指定 1 到 10 之间的尝试次数。如果尝试次数大于 1,则作业在失败后将重试,直到它进入 RUNNABLE 状态的次数达到指定值。

默认值:1

-t TIMEOUT, --timeout TIMEOUT

指定持续时间(以秒为单位)(根据任务尝试startedAt的时间戳衡量),如果任务尚未完成,则该持续时间后 Amazon Batch 将终止作业。超时值必须至少为 60 秒。

-n NODES, --nodes NODES

指定要为作业预留的节点数量。为此参数指定一个值,以启用多节点并行提交。

注意

cluster_type 参数设置为 spot 时,不支持多节点并行作业。

-a ARRAY_SIZE, --array-size ARRAY_SIZE

指示数组的大小。您可以指定 2 到 10000 之间的值。如果您为一个作业指定数组属性,该作业将变为数组作业。

-d DEPENDS_ON, --depends-on DEPENDS_ON

指定作业的依赖项的分号分隔的列表。一个作业可依赖于最多 20 个作业。您可以指定 SEQUENTIAL 类型依赖项,而不指定数组作业的作业 ID。顺序依赖项允许每个子数组作业按顺序完成,从索引 0 开始。您也可以使用数组作业的作业 ID 指定 N_TO_N 类型依赖项。N_TO_N 依赖项意味着此作业的每个子索引必须等待每个依赖项的相应子索引完成后才能开始。此参数的语法为 "jobId=<string>,类型=<string>;...".