问题排查 - 亚马逊 SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

问题排查

如果在使用Amazon SageMaker Data Wranager 出现问题进行故障排除。

  • 如果提供错误消息。

  • 确保您的 Studio 用户的 IAM 角色具有执行操作所需的权限。有关更多信息,请参阅安全和权限

  • 如果您在尝试从其他Amazon服务(例如 Amazon Redshift 或 Athena)导入时出现问题,请确保已配置执行数据导入所需的权限和资源。有关更多信息,请参阅导入

  • 如果您仍然遇到问题,请选择屏幕右上角的 “获取帮助” 以联系 Data Wrangler 团队。有关更多信息。

作为最后的手段,你可以尝试重新启动运行 Data Wrangler 的内核。

  1. 保存并退出您要重启内核的内核的文件。

  2. 选择 “运行终端和内核” 图标,如下图所示。

  3. 选择要终内核的.flow 文件右侧的 “停止” 图标,如下图所示。

  4. 刷浏览器浏览器浏览器浏览器浏览器浏览器浏览器浏览器

  5. 重新打开您正在处理的.flow 文件。

Amazon EMR 出现的问题进行故障排除

可以使用以下信息帮助对 Amazon EMR 出现的问题进行故障排除。

  • 连接失败-如果连接失败并显示以下消息The IP address of the EMR cluster isn't private error message,则您的 Amazon EMR 集群可能未在私有子网中启动。作为安全最佳实践。选择一个私有 EC2 子网即可启动 EMR 集群。

  • 连接挂起和超时 — 该问题很可能是由于网络连接问题造成的。开始连接到集群后,屏幕不会刷新。大约 2 分钟后JdbcAddConnectionError: An error occurred when trying to connect to presto: xxx: Connect to xxx failed: Connection timed out (Connection timed out) will display on top of the screen.

    错误可能有两个根本原因:

    • 亚马逊 EMR 和亚马逊 SageMaker 工作室位于不同的 VPC 中。我们建议在同一 VPC 中同时启动亚马逊 EMR 和 Studio。您也可以使用 VPC 对等连接。有关更多信息

    • 亚马逊 EMR 主安全组缺少用于 Presto 的端口上的 Amazon SageMaker Studio 安全组的入站流量规则。要解决此问题,请允许端口 8889 上的入站流量。

  • 由于连接类型的相关问题: Data Wrangler couldn't create a connection to {connection_source} successfully. Try connecting to {connection_source} again. For more information, see Troubleshoot. If you’re still experiencing issues, contact support.

    检查身份验证方法。您在 Data Wrangler 中指定的身份验证方法应与您在集群上使用的身份验证方法相匹配。

  • 您没有 LDAP 身份验证的 HDFS 权限 — 使用以下指南解决使用 Linux 凭据设置 HDFS 权限的问题。您可以使用以下命令登录集群

    hdfs dfs -mkdir /user/USERNAME hdfs dfs -chown USERNAME:USERNAME /user/USERNAME
  • LDAP 身份验证缺少连接密钥的错误Data Wrangler couldn't connect to EMR hive successfully. JDBC connection is missing required connection key(s): PWD

    对于 LDAP 身份验证,必须同时指定用户名和密码。存储在Secrets Manager 中的 JDBC URL 缺少属性PWD

  • 对 LDAP 配置进行故障排除时:我们建议确保正确配置 LDAP 身份验证器(LDAP 服务器)以连接到 Amazon EMR 集群。可以使用ldapwhoami命令帮助解决配置问题。以下是您可以运行的示例命令:

    • 对于 LDAPS —ldapwhoami -x -H ldaps://ldap-server

    • 对于 LDAP —ldapwhoami -x -H ldap://ldap-server

    Anonymous如果您成功配置了身份验证器,则任一命令都应返回。