将基于 Git 的存储库与 EMR Notebooks 关联 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将基于 Git 的存储库与 EMR Notebooks 关联

注意

EMR Notebooks 可在控制台中作为 EMR Studio 工作区使用。控制台中的 “创建工作区” 按钮允许您创建新的笔记本。要访问或创建 Workspaces,EMR Notebooks 用户需要额外的 IAM 角色权限。有关更多信息,请参阅 Amazon EMR 笔记本是控制台中的 Amazon EMR Studio 工作空间和亚马逊 EMR 控制台。

可以将基于 Git 的存储库与 Amazon EMR Notebooks 关联,以将笔记本保存在版本控制的环境中。一个笔记本最多可与三个存储库关联。支持以下基于 Git 的服务:

将基于 Git 的存储库与您的笔记本相关联后,将会获得以下优势。

  • 版本控制 – 您可以在版本控制系统中记录代码更改,以便查看更改历史记录并有选择地撤消一些更改。

  • 协作 – 在不同笔记本中工作的同事可以通过基于 Git 的远程存储库共享代码。笔记本可以从远程存储库克隆或合并代码,然后将更改推送回这些远程存储库。

  • 代码重用 — 许多演示数据分析或机器学习技术的 Jupyter 笔记本都可以在公共托管的存储库中找到,例如。 GitHub可以将您的笔记本与存储库关联,以便重用包含在该存储库中的 Jupyter notebook。

要将基于 Git 的存储库与 EMR Notebooks 结合使用,请在 Amazon EMR 控制台中添加存储库作为资源,关联需要身份验证的存储库的凭证,然后将这些存储库与笔记本链接起来。您可在 Amazon EMR 控制台中查看存储在账户中的存储库列表以及各个存储库的详细信息。在创建基于 Git 的现有存储库时,可以将这些存储库与笔记本关联。