更新 Amazon MWAA 环境 - Amazon Managed Workflows for Apache Airflow
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

更新 Amazon MWAA 环境

注意

加拿大西部(卡尔加里)和亚太地区(马来西亚)地区尚不支持 Amazon MWAA 优雅更新。

Amazon MWAA 环境更新会应用最新更改和安全补丁。您还可以编辑现有配置并升级 Apache Airflow 版本。本指南描述了更新 Amazon MWAA 环境的步骤。

开始前的准备工作

  • 创建环境后,无法修改您为环境指定的 VPC 网络

  • 您需要将 Amazon S3 存储桶配置为阻止所有公开访问并启用存储桶版本控制

  • 您需要一个拥有使用 Amazon MWAA 的权限以及在 Amazon Identity and Access Management (IAM) 中创建 IAM 角色的权限的 Amazon 账户。如果您为 Apache Airflow Web 服务器选择的是私有网络访问模式,由于该模式会限制 Amazon VPC 内的 Apache Airflow 访问权限,因此您需要 IAM 中的权限才能创建 Amazon VPC 端点。

  • 要启用 Graceful 环境更新,你需要升级到 Apache Airflow 版本 2.4.3 或更高版本。要升级 Airflow 版本,请参阅升级 Apache Airflow 版本

员工更换策略

您可以选择工作人员更换策略来控制 Amazon MWAA 在环境更新期间如何处理活跃员工。您可以选择以下策略之一:

强制更新

强制更新是默认的工作人员替换策略。强制更新会立即停止所有活跃的工作人员,从而导致正在运行的任务在更新期间失败。

优雅的更新

优雅的更新允许工作人员在关闭之前继续运行任务长达 12 小时。它可以防止任务由于更新中断而失败,前提是这些任务在 12 小时内完成。新任务将发送给更新的工作人员。

要在现有环境上启用平滑更新,必须完成一次强制更新,并确保该环境使用的是 Apache Airflow 版本 2.4.3 或更高版本。

更新环境资源

默认情况下,Amazon MWAA 环境更新使用现有环境配置。要在不更改当前配置的情况下更新环境,请执行以下操作:

  1. 在 Amazon MWAA 控制台上打开环境页面

  2. 从 “环境” 列表中,选择要更新的环境。

  3. 在环境页面上,选择编辑以编辑环境。

  4. 选择下一步,直到进入查看并保存页面。

  5. 查看并保存页面上,查看更改,然后选择保存

更新环境

以下部分介绍更新 Amazon MWAA 环境的步骤。

步骤 1:指定详细信息

要指定环境的详细信息,请执行以下操作
  1. 在 Amazon MWAA 控制台上打开环境页面

  2. 从 “环境” 列表中,选择要更新的环境。

  3. 在环境页面上,选择编辑以编辑环境。

  4. 在环境详细信息部分,对于 Airflow 版本,从下拉列表中选择要将环境升级到的新 Apache Airflow 版本号。

    注意

    在升级之前,请确保您的 DAGs 和其他工作流程资源与新的 Apache Airflow 版本兼容。有关更多信息,请参阅 升级 Apache Airflow 版本

  5. Amazon S3 的 DAG 代码下指定以下内容:

    1. S3 Bucket。选择浏览 S3 并选择 Amazon S3 存储桶,或者输入 Amazon S3 URI。

    2. DAGs folder。选择浏览 S3,然后选择 Amazon S3 存储桶中的 dags 文件夹,或者输入 Amazon S3 URI。

    3. 插件文件-可选。选择浏览 S3,然后选择 Amazon S3 存储桶上的 plugins.zip 文件,或者输入 Amazon S3 URI。

    4. 要求文件-可选。选择浏览 S3,然后选择 Amazon S3 存储桶上的 requirements.txt 文件,或者输入 Amazon S3 URI。

    5. 启动脚本文件-可选,选择浏览 S3并选择 Amazon S3 存储桶上的脚本文件,或者输入 Amazon S3 URI。

  6. 选择下一步

步骤 2:配置高级设置

配置高级设置
  1. Web 服务器访问下,选择您首选的 Apache Airflow 访问模式

    1. 私有网络。这限制了对 Apache Airflow UI 的访问,只有在 Amazon VPC 中已获得 环境的 IAM 策略访问权限的用户才能访问。您需要获得权限才能为此步骤创建 Amazon VPC 端点。

      注意

      如果 Apache Airflow UI 只能在公司网络中访问,并且不需要访问公共存储库即可进行 Web 服务器要求安装,请选择私有网络选项。如果您选择此访问模式选项,则需要创建一种机制来访问 Amazon VPC 中的 Apache Airflow Web 服务器。有关更多信息,请参阅 访问 Apache Airflow Web 服务器的 VPC 端点(私有网络访问)

    2. 公有网络。这使获得环境的 IAM 策略访问权限的用户可以通过互联网访问 Apache Airflow UI。

  2. 安全组下,选择用于保护 Amazon VPC 的安全组:

    1. 默认情况下,Amazon MWAA 会在 Amazon VPC 中创建一个安全组,并在创建新安全组中使用特定的入站和出站规则。

    2. 可选。取消选中创建新安全组中的复选框可选择最多 5 个安全组。

      注意

      现有 Amazon VPC 安全组必须配置特定的入站和出站规则,才能允许网络流量。要了解更多信息,请参阅Amazon MWAA 上的 VPC 安全

  3. 环境类下,选择一个环境类

    我们建议选择支持您的工作负载所需的最小尺寸。您可以随时更改环境类。

  4. 对于最大工作线程计数,请指定要在环境中运行的 Apache Airflow 工作线程的最大数量。

    有关更多信息,请参阅 高性能用例示例

  5. 指定最大 Web 服务器数最小 Web 服务器数,以配置 Amazon MWAA 如何在环境中扩展 Apache Airflow Web 服务器。

    有关 Web 服务器自动扩缩的更多信息,请参阅配置 Amazon MWAA Web 服务器自动扩缩

  6. 加密下,选择一个数据加密选项:

    1. 默认情况下,Amazon MWAA 使用 Amazon 自有密钥来加密您的数据。

    2. 可选。选择 “自定义加密设置(高级)” 以选择其他 Amazon KMS 密钥。如果您选择在此步骤中指定客户托管密钥,则必须指定 Amazon KMS 密钥 ID 或 ARN。Amazon KMS A@@ mazon MWAA 不支持别名和多区域密钥。如果您在 Amazon S3 存储桶上指定了用于服务器端加密的 Amazon S3 密钥,则必须为 Amazon MWAA 环境指定相同的密钥。

      注意

      您必须拥有该密钥的权限才能在 Amazon MWAA 控制台上选择该密钥。您还必须通过 附加密钥政策 中所述的附加策略授予 Amazon MWAA 使用密钥的权限。

  7. 推荐。在 “监控” 下,为 Airflow 日志配置选择一个或多个日志类别,将 Apache Airflow 日志发送到日志: CloudWatch

    1. Airflow 任务日志。选择要发送到日志级别的 Apache Airflow 任务 CloudWatch 日志的类型。

    2. Airflow Web 服务器日志。选择要发送到 “登录日志” 级别的 Apache Airflow Web 服务器 CloudWatch 日志的类型。

    3. Airflow 计划程序日志选择要发送到 “登录日志” 级别的 Apache Airflow 调度程序 CloudWatch 日志的类型。

    4. Airflow 工作线程日志。选择要发送到 “登录日志” 级别的 Apache Airflow 工作 CloudWatch 日志的类型。

    5. Airflow DAG 处理日志。选择要发送到日志级别的 Apache Airflow DAG 处理 CloudWatch 日志的类型。

  8. 可选。对于 Airflow 配置选项,选择添加自定义配置选项

    您可以从 Apache Airflow 版本的 Apache Airflow 配置选项的建议下拉列表中进行选择,也可以指定自定义配置选项。例如 core.default_task_retries : 3

  9. 权限下,选择一个执行角色。

    1. 默认情况下,Amazon MWAA 会在创建新角色中创建一个执行角色。您必须具有创建 IAM 角色的权限,才能使用此选项。

    2. 可选。选择输入角色 ARN 输入现有执行角色的 Amazon 资源名称(ARN)。

  10. 在 “更新规范” 下,选择 a 员工更换策略 以控制更新期间如何处理活跃工作人员。

  11. 选择下一步

第三步:查看和更新

要查看环境摘要,请执行以下操作
  • 查看环境摘要,选择保存

    注意

    使用强制更新来更新环境大约需要二十到三十分钟。优雅的环境更新可能需要长达十二个小时才能完成,因为它需要等待你正在进行的任务完成。