先决条件 - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

先决条件

开始之前,请设置以下项目:

  • 一个 Amazon 账户 — 如果你还没有,请从这里开始设置一个新 Amazon 账户

  • 有权访问所需权限的 Amazon Identity and Access Management (IAM) 用户 DataBrew — 有关更多信息,请参阅添加具有 DataBrew 权限的用户或群组

  • 在 DataBrew 操作中使用的 IAM 角色 — 您可以使用默认角色(如果AwsGlueDataBrewDataAccessRole已配置)。要设置其他 IAM 角色,请参阅添加具有数据资源权限的 IAM 角色

  • JupyterLab 安装(版本 2.2.6 或更高版本)— 有关更多信息,请参阅JupyterLab文档中的以下主题:

  • Node.js 安装(版本 12.0 或更高版本)。

  • Amazon Command Line Interface (Amazon CLI) 安装-有关更多信息,请参阅设置 Amazon CLI

  • Amazon Jupyter 代理安装 (pip install aws-jupyter-proxy) — 此扩展与 Amazon 服务端点一起使用,可安全地传递您的 Amazon 凭据。有关更多信息,请参aws-jupyter-proxy阅 GitHub。

要验证是否已安装必备组件,可以在命令行运行类似于以下内容的测试,如以下示例所示。

echo " AWS CLI:" which aws aws --version aws configure list aws sts get-caller-identity echo " Python (current environment):" which python python --version echo " Node.JS:" which node node --version echo " Jupyter:" where jupyter jupyter --version jupyter serverextension list pip3 freeze | grep jupyter

输出应与以下内容类似。目录因操作系统和配置而异。

AWS CLI: /usr/local/bin/aws aws-cli/2.1.2 Python/3.7.4 Darwin/19.6.0 exe/x86_64 Name Value Type Location ---- ----- ---- -------- profile <not set> None None access_key ****************VXW4 shared-credentials-file secret_key ****************MRJN shared-credentials-file region us-east-1 config-file ~/.aws/config { "UserId": "", "Account": "111122223333", "Arn": "arn:aws:iam::111122223333:user/user2" } Python (current environment): /usr/local/opt/python /libexec/bin/python Python 3.8.5 Node.JS: /usr/local/bin/node v15.0.1 Jupyter: /usr/local/bin/jupyter jupyter core : 4.6.3 jupyter-notebook : 6.0.3 qtconsole : 4.7.5 ipython : 7.16.1 ipykernel : 5.3.2 jupyter client : 6.1.6 jupyter lab : 2.2.9 nbconvert : 5.6.1 ipywidgets : 7.5.1 nbformat : 5.0.7 traitlets : 4.3.3 config dir: /usr/local/etc/jupyter aws_jupyter_proxy enabled - Validating... aws_jupyter_proxy OK jupyterlab enabled - Validating... jupyterlab 2.2.9 OK aws-jupyter-proxy==0.1.0 jupyter-client==6.1.7 jupyter-core==4.7.0 jupyterlab==2.2.9 jupyterlab-pygments==0.1.2 jupyterlab-server==1.2.0