

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# Amazon MWAA 故障排除
<a name="troubleshooting"></a>

本章介绍在 Amazon MWAA 上使用 Apache Airflow 时可能遇到的常见问题和错误，以及解决这些错误的推荐步骤。

**Contents**
+ [故障排除： DAGs、操作员、连接和其他问题](t-apache-airflow-202.md)
  + [Connections](t-apache-airflow-202.md#troubleshooting-conn-202)
    + [我无法连接 Secrets Manager](t-apache-airflow-202.md#access-secrets-manager)
    + [如何在我的执行角色策略中配置 `secretsmanager:ResourceTag/<tag-key>` Secrets Manager 条件或资源限制？](t-apache-airflow-202.md#access-secrets-manager-condition-keys)
    + [我无法连接 Snowflake](t-apache-airflow-202.md#missing-snowflake)
    + [我无法在 Airflow UI 中找到我的连接](t-apache-airflow-202.md#connection-type-missing)
  + [Webserver](t-apache-airflow-202.md#troubleshooting-webserver-202)
    + [我在访问 Web 服务器时收到 5xx 错误](t-apache-airflow-202.md#5xx-webserver-202)
    + [我收到 `The scheduler does not seem to be running` 错误](t-apache-airflow-202.md#error-scheduler-202)
  + [任务](t-apache-airflow-202.md#troubleshooting-tasks-202)
    + [我的任务卡顿或者没有完成](t-apache-airflow-202.md#stranded-tasks-202)
    + [我在 Airflow v3 中任务失败，但没有日志](t-apache-airflow-202.md#failed-task-no-log)
  + [CLI](t-apache-airflow-202.md#troubleshooting-cli-202)
    + [在 CLI 中触发 DAG 时我收到“503”错误](t-apache-airflow-202.md#cli-toomany-202)
    + [为什么 `dags backfill` Apache Airflow CLI 命令会失败？ 是否有解决方法？](t-apache-airflow-202.md#troubleshooting-cli-backfill)
  + [运算符](t-apache-airflow-202.md#troubleshooting-operators-202)
    + [我在使用 S3Transform 运算符时遇到了 `PermissionError: [Errno 13] Permission denied` 错误](t-apache-airflow-202.md#op-s3-transform)
+ [故障排除：创建和更新 Amazon MWAA 环境](t-create-update-environment.md)
  + [更新 `requirements.txt`](t-create-update-environment.md#troubleshooting-reqs)
    + [我指定了 `requirements.txt` 的新版本，更新环境花了 20 多分钟](t-create-update-environment.md#t-requirements)
  + [插件](t-create-update-environment.md#troubleshooting-plugins)
    + [Amazon MWAA 是否支持实现自定义 UI？](t-create-update-environment.md#custom-ui)
  + [创建存储桶](t-create-update-environment.md#troubleshooting-create-bucket)
    + [我无法选择 S3 阻止公共访问设置的选项](t-create-update-environment.md#t-create-bucket)
  + [创建环境。](t-create-update-environment.md#troubleshooting-create-environment)
    + [我尝试创建环境，但它一直处于 `Creating` 状态](t-create-update-environment.md#t-stuck-failure)
    + [我尝试创建环境，但它的状态显示为 `Create failed`](t-create-update-environment.md#t-create-environ-failed)
    + [我尝试选择 VPC 但收到 `Network Failure` 错误](t-create-update-environment.md#t-network-failure)
    + [我尝试创建环境但收到服务、分区或资源“必须传递”错误](t-create-update-environment.md#t-service-partition)
    + [我尝试创建环境，它的状态显示为 `Available`，但是当我尝试访问 Airflow UI 时，会显示 `Empty Reply from Server` 或 `502 Bad Gateway` 错误](t-create-update-environment.md#t-create-environ-empty-reply)
    + [我尝试创建一个环境，我的用户名是一堆随机的字符名称](t-create-update-environment.md#t-create-environ-random-un)
  + [Update environment](t-create-update-environment.md#troubleshooting-update-environment)
    + [我尝试更改环境类，但更新失败了](t-create-update-environment.md#t-rollback-billing-failure)
  + [访问环境](t-create-update-environment.md#troubleshooting-access-environment)
    + [我无法访问 Apache Airflow UI](t-create-update-environment.md#t-no-access-airflow-ui)
+ [故障排除：CloudWatch Logs 和 CloudTrail 错误](t-cloudwatch-cloudtrail-logs.md)
  + [日志](t-cloudwatch-cloudtrail-logs.md#troubleshooting-view-logs)
    + [我找不到我的任务日志，或者我收到了 `Reading remote log from Cloudwatch log_group` 错误](t-cloudwatch-cloudtrail-logs.md#t-task-logs)
    + [任务在没有任何日志的情况下失败](t-cloudwatch-cloudtrail-logs.md#t-task-failing-no-logs)
    + [我在 CloudTrail 中遇到了 `ResourceAlreadyExistsException` 错误](t-cloudwatch-cloudtrail-logs.md#t-cloudtrail)
    + [我在 CloudTrail 中看到了 `Invalid request` 错误](t-cloudwatch-cloudtrail-logs.md#t-cloudtrail-bucket)
    + [我在 Apache Airflow 日志中看到了 `Cannot locate a 64-bit Oracle Client library: "libclntsh.so: cannot open shared object file: No such file or directory`](t-cloudwatch-cloudtrail-logs.md#t-plugins-logs)
    + [我在我的计划程序日志中看到了 psycopg2“服务器意外关闭了连接”](t-cloudwatch-cloudtrail-logs.md#scheduler-postgres-library)
    + [我在我的 DAG 处理日志中看到了 `Executor reports task instance %s finished (%s) although the task says its %s`](t-cloudwatch-cloudtrail-logs.md#long-running-tasks)
    + [我在我的任务日志中看到了 `Could not read remote logs from log_group: airflow-*{*environmentName}-Task log_stream:* {*DAG_ID}/*{*TASK_ID}/*{*time}/*{*n}.log.`](t-cloudwatch-cloudtrail-logs.md#t-task-fail-permission)