本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
进行设置以便将 Python 与 AWS Glue 一起使用
使用 Python 为 Spark 作业开发 ETL 脚本。ETL 作业支持的 Python 版本取决于作业的 AWS Glue 版本。有关 AWS Glue 版本的更多信息,请参阅 Glue version job property。
设置您的系统以便将 Python 与 AWS Glue 一起使用
请按照以下步骤安装 Python 并能够调用 AWS Glue APIs。
-
如果您还没有安装 Python,请从 Python.org 下载页面
进行下载和安装。 -
按照 AWS Command Line InterfaceAWS CLI 文档AWS CLI所述安装 ()。
AWS CLI 不是使用 Python 所直接必需的。但是,安装和配置它是使用账户凭证设置 AWS 并验证它们是否工作的方便方法。
-
按照 Boto3 快速入门
所述安装 AWS SDK for Python (Boto 3)。 Boto 3 资源 APIs 尚不可用于 AWS Glue。目前,只能使用 Boto 3 客户端 APIs。
有关 Boto 3 的更多信息,请参阅适用于 Python 的 AWS 开发工具包 (Boto3) 使用入门
。
您可以在 AWS Glue 网站上的 AWS Glue 示例存储库