

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 故障排除 Amazon Batch
<a name="troubleshooting"></a>

可能需要排除与计算环境、作业队列、作业定义或作业相关的问题。本章介绍如何对您的 Amazon Batch 环境中的此类问题进行故障排除和解决。

Amazon Batch 使用 IAM 策略、角色和权限，在亚马逊 EC2、Amazon ECS 和亚马逊 Elastic Kubernetes Service 基础设施上运行。 Amazon Fargate要解决与这些服务相关的问题，请参阅以下内容：
+ *《IAM 用户指南》*中的 [IAM 故障排除](https://docs.amazonaws.cn/IAM/latest/UserGuide/troubleshoot.html)
+ *Amazon Elastic Container Service 开发人员指南*中的[Amazon ECS 故障排除](https://docs.amazonaws.cn/AmazonECS/latest/userguide/troubleshooting.html)
+ *《Amazon EKS 用户指南》*中的[ Amazon EKS 故障排除](https://docs.amazonaws.cn/eks/latest/userguide/troubleshooting.html)
+ 《Amazon EC2 用户指南》**中的[排查 EC2 实例的问题](https://docs.amazonaws.cn/AWSEC2/latest/UserGuide/ec2-instance-troubleshoot.html)

**Contents**
+ [Amazon Batch](batch-troubleshooting.md)
  + [用于接收自动实例系列更新的最佳实例类型配置](optimal-default-instance-troubleshooting.md)
  + [`INVALID` 计算环境](invalid_compute_environment.md)
    + [角色名称或 ARN 不正确](invalid_compute_environment.md#invalid_service_role_arn)
    + [修复 `INVALID` 计算环境](invalid_compute_environment.md#repairing_invalid_compute_environment)
  + [作业在`RUNNABLE`状态卡住](job_stuck_in_runnable.md)
  + [创建时未标记的竞价型实例](spot-instance-no-tag.md)
  + [竞价型实例无法缩减](spot-fleet-not-authorized.md)
    + [将 **Amazon EC2 SpotFleetTaggingRole** 托管策略附加到您的 Spot 队列角色中 Amazon Web Services 管理控制台](spot-fleet-not-authorized.md#spot-fleet-not-authorized-console)
    + [将 **Amazon EC2 SpotFleetTaggingRole** 托管策略附加到您的 Spot 队列角色中 Amazon CLI](spot-fleet-not-authorized.md#spot-fleet-not-authorized-cli)
  + [无法检索 Secrets Manager 密文](troubleshooting-cant-specify-secrets.md)
  + [无法覆盖作业定义资源需求](override-resource-requirements.md)
  + [更新`desiredvCpus`设置时出现错误消息](error-desired-vcpus-update.md)
+ [Amazon Batch 在亚马逊 EKS 上](batch-eks-troubleshooting.md)
  + [`INVALID` 计算环境](batch_eks_invalid_compute_environment.md)
    + [不支持的Kubernetes版本](batch_eks_invalid_compute_environment.md#invalid_kubernetes_version)
    + [实例配置文件不存在](batch_eks_invalid_compute_environment.md#instance_profile_not_exist)
    + [Kubernetes命名空间无效](batch_eks_invalid_compute_environment.md#invalid_kubernetes_namespace)
    + [已删除的计算环境](batch_eks_invalid_compute_environment.md#deleted_compute_environment)
    + [节点未加入 Amazon EKS 集群](batch_eks_invalid_compute_environment.md#batch_eks_node_not_join_cluster)
  + [Amazon Batch 在 Amazon 上，EKS 的工作处于`RUNNABLE`状态状态](batch_eks_job_stuck_in_runnable.md)
  + [Amazon Batch 在 Amazon 上，EKS 的工作处于`STARTING`状态状态](batch-eks-job-stuck-in-starting.md)
    + [场景：持久卷声明连接或挂载失败](batch-eks-job-stuck-in-starting.md#batch-eks-job-stuck-in-starting-scenario)
  + [验证`aws-auth ConfigMap`是否配置正确。](verify-configmap-config.md)
  + [RBAC 权限或绑定配置不正确](batch_eks_rbac.md)