将基于 Git 的存储库与 EMR Notebooks 关联 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

将基于 Git 的存储库与 EMR Notebooks 关联

可以将基于 Git 的存储库与 Amazon EMR Notebooks 关联,以将笔记本保存在版本控制的环境中。一个笔记本最多可与三个存储库关联。支持以下基于 Git 的服务:

将基于 Git 的存储库与您的笔记本相关联后,将会获得以下优势。

  • 版本控制 – 您可以在版本控制系统中记录代码更改,以便查看更改历史记录并有选择地撤消一些更改。

  • 协作 – 在不同笔记本中工作的同事可以通过基于 Git 的远程存储库共享代码。笔记本可以从远程存储库克隆或合并代码,然后将更改推送回这些远程存储库。

  • 代码重用 – 许多演示数据分析或机器学习技术的 Jupyter 笔记本可在公开托管的存储库上提供,例如 GitHub。可以将您的笔记本与存储库关联,以便重用包含在该存储库中的 Jupyter 笔记本。

要将基于 Git 的存储库与 EMR Notebooks 结合使用,请在 Amazon EMR 控制台中添加存储库作为资源,关联需要身份验证的存储库的凭证,然后将这些存储库与笔记本链接起来。您可在 Amazon EMR 控制台中查看存储在账户中的存储库列表以及各个存储库的详细信息。在创建基于 Git 的现有存储库时,可以将这些存储库与笔记本关联。