本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
进行设置以便将 Python 与 Amazon Glue 一起使用
使用 Python 为 Spark 作业开发 ETL 脚本。ETL 任务支持的 Python 版本取决于任务的 Amazon Glue 版本。有关 Amazon Glue 版本的更多信息,请参阅 Glue version job property。
设置您的系统以便将 Python 与 Amazon Glue 一起使用
按照以下步骤安装 Python 并能够调用 Amazon Glue API。
-
如果您还没有安装 Python,请从 Python.org 下载页面
进行下载和安装。 -
按照 Amazon CLI 文档中所述安装 Amazon Command Line Interface(Amazon CLI)。
Amazon CLI 不是使用 Python 所直接必需的。但是,安装和配置它是使用账户凭证设置 Amazon 并验证它们是否工作的方便方法。
-
按照 Boto3 快速入门
所述安装 Amazon SDK for Python(Boto 3)。 Boto 3 资源 API 尚不可用于 Amazon Glue。目前,只有 Boto 3 客户端 API 可用。
有关 Boto 3 的更多信息,请参阅 Amazon SDK for Python(Boto3)入门
。
您可以在 GitHub 网站上的 Amazon Glue 示例存储库