本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
将基于 Git 的存储库与 EMR Notebooks 关联
可以将基于 Git 的存储库与 Amazon EMR Notebooks 关联,以将笔记本保存在版本控制的环境中。一个笔记本最多可与三个存储库关联。支持以下基于 Git 的服务:
注意
EMR Notebooks 在控制台中作为 Amazon EMR Studio Workspaces 提供。通过控制台中的创建工作区按钮,可以创建新的笔记本。要访问或创建 Workspaces,EMR Notebooks 用户需要额外的 IAM 角色权限。有关更多信息,请参阅 Amazon EMR Notebooks 是控制台中的 Amazon EMR Studio Workspaces 和 Amazon EMR 控制台。
将基于 Git 的存储库与您的笔记本相关联后,将会获得以下优势。
-
版本控制 – 您可以在版本控制系统中记录代码更改,以便查看更改历史记录并有选择地撤消一些更改。
-
协作 – 在不同笔记本中工作的同事可以通过基于 Git 的远程存储库共享代码。笔记本可以从远程存储库克隆或合并代码,然后将更改推送回这些远程存储库。
-
代码重用 – 许多演示数据分析或机器学习技术的 Jupyter notebook 可在公开托管的存储库上提供,例如 GitHub。可以将您的笔记本与存储库关联,以便重用包含在该存储库中的 Jupyter notebook。
要将基于 Git 的存储库与 EMR Notebooks 结合使用,请在 Amazon EMR 控制台中添加存储库作为资源,关联需要身份验证的存储库的凭证,然后将这些存储库与笔记本链接起来。您可在 Amazon EMR 控制台中查看存储在账户中的存储库列表以及各个存储库的详细信息。在创建基于 Git 的现有存储库时,可以将这些存储库与笔记本关联。