进行设置以便将 Python 与 AWS Glue 一起使用 - AWS Glue
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

进行设置以便将 Python 与 AWS Glue 一起使用

使用 Python 为 Spark 作业开发 ETL 脚本。ETL 作业支持的 Python 版本取决于作业的 AWS Glue 版本。有关 AWS Glue 版本的更多信息,请参阅 Glue version job property

设置您的系统以便将 Python 与 AWS Glue 一起使用

请按照以下步骤安装 Python 并能够调用 AWS Glue APIs。

  1. 如果您还没有安装 Python,请从 Python.org 下载页面进行下载和安装。

  2. 按照 AWS Command Line InterfaceAWS CLI 文档AWS CLI所述安装 ()。

    AWS CLI 不是使用 Python 所直接必需的。但是,安装和配置它是使用账户凭证设置 AWS 并验证它们是否工作的方便方法。

  3. 按照 Boto3 快速入门所述安装 AWS SDK for Python (Boto 3)。

    Boto 3 资源 APIs 尚不可用于 AWS Glue。目前,只能使用 Boto 3 客户端 APIs。

    有关 Boto 3 的更多信息,请参阅适用于 Python 的 AWS 开发工具包 (Boto3) 使用入门

您可以在 AWS Glue 网站上的 AWS Glue 示例存储库中找到 GitHub 的 Python 代码示例和实用程序。