本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
问题排查
如果在使用Amazon SageMaker Data Wranager 出现问题进行故障排除。
作为最后的手段,你可以尝试重新启动运行 Data Wrangler 的内核。
-
保存并退出您要重启内核的内核的文件。
-
选择 “运行终端和内核” 图标,如下图所示。
-
选择要终止内核的.flow 文件右侧的 “停止” 图标,如下图所示。
-
刷浏览器浏览器浏览器浏览器浏览器浏览器浏览器浏览器
-
重新打开您正在处理的.flow 文件。
Amazon EMR 出现的问题进行故障排除
可以使用以下信息帮助对 Amazon EMR 出现的问题进行故障排除。
-
连接失败-如果连接失败并显示以下消息
The IP address of the EMR cluster isn't private error message
,则您的 Amazon EMR 集群可能未在私有子网中启动。作为安全最佳实践。选择一个私有 EC2 子网即可启动 EMR 集群。 -
连接挂起和超时 — 该问题很可能是由于网络连接问题造成的。开始连接到集群后,屏幕不会刷新。大约 2 分钟后
JdbcAddConnectionError: An error occurred when trying to connect to presto: xxx: Connect to xxx failed: Connection timed out (Connection timed out) will display on top of the screen.
。错误可能有两个根本原因:
-
亚马逊 EMR 和亚马逊 SageMaker 工作室位于不同的 VPC 中。我们建议在同一 VPC 中同时启动亚马逊 EMR 和 Studio。您也可以使用 VPC 对等连接。有关更多信息。 。
-
亚马逊 EMR 主安全组缺少用于 Presto 的端口上的 Amazon SageMaker Studio 安全组的入站流量规则。要解决此问题,请允许端口 8889 上的入站流量。
-
-
由于连接类型的相关问题:
Data Wrangler couldn't create a connection to {connection_source} successfully. Try connecting to {connection_source} again. For more information, see Troubleshoot. If you’re still experiencing issues, contact support.
检查身份验证方法。您在 Data Wrangler 中指定的身份验证方法应与您在集群上使用的身份验证方法相匹配。
-
您没有 LDAP 身份验证的 HDFS 权限 — 使用以下指南解决使用 Linux 凭据设置 HDFS 权限的问题。您可以使用以下命令登录集群
hdfs dfs -mkdir /user/USERNAME hdfs dfs -chown USERNAME:USERNAME /user/USERNAME
-
LDAP 身份验证缺少连接密钥的错误
Data Wrangler couldn't connect to EMR hive successfully. JDBC connection is missing required connection key(s): PWD
。对于 LDAP 身份验证,必须同时指定用户名和密码。存储在Secrets Manager 中的 JDBC URL 缺少属性
PWD
。 -
对 LDAP 配置进行故障排除时:我们建议确保正确配置 LDAP 身份验证器(LDAP 服务器)以连接到 Amazon EMR 集群。可以使用
ldapwhoami
命令帮助解决配置问题。以下是您可以运行的示例命令:-
对于 LDAPS —
ldapwhoami -x -H ldaps://ldap-server
-
对于 LDAP —
ldapwhoami -x -H ldap://ldap-server
Anonymous
如果您成功配置了身份验证器,则任一命令都应返回。 -