对 Amazon EMR on EKS 垂直自动扩展进行问题排查 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

对 Amazon EMR on EKS 垂直自动扩展进行问题排查

如果您在使用 Operator Lifecycle Manager 在 Amazon EKS 集群上设置 Amazon EMR on EKS 垂直自动扩展运算符时遇到问题,请参阅以下部分。有关更多信息(包括完成安装的步骤),请参阅 使用垂直自动扩展功能处理 Amazon EMR Spark 任务

403 禁止错误

如果您按照 olm status 中的步骤运行了 在 Amazon EKS 集群上安装 Operator Lifecycle Manager(OLM) 命令,并且返回了如下所示的 403 Forbidden 错误,则说明您可能尚未获取运算符的 Amazon ECR 存储库身份验证令牌。

要解决此问题,请重复 安装 Amazon EMR on EKS 垂直自动扩展 Operator 中的步骤以获取令牌。然后,再次尝试安装。

Error: FATA[0002] Failed to run bundle: pull bundle image: error pulling image IMAGE. error resolving name : unexpected status code [manifests latest]: 403 Forbidden

未找到 Kubernetes 命名空间

Amazon EKS 集群上设置 Amazon EMR on EKS 垂直自动扩展运算符时,可能会出现 namespaces not found 错误,如下所示:

FATA[0020] Failed to run bundle: create catalog: error creating catalog source: namespaces "NAME" not found.

如果您指定的命名空间不存在,OLM 将不会安装垂直自动扩展运算符。要解决此问题,请使用以下命令创建命名空间。然后,再次尝试安装。

kubectl create namespace NAME

保存 Docker 凭证时出错

设置垂直自动扩展,您必须进行身份验证并获取与 Amazon EMR on EKS 垂直自动扩展相关的 Docker 映像。执行此操作时,如果 Docker 没有运行,您可能会收到类似以下的错误:

aws ecr get-login-password \ --region $REGION | docker login \ --username AWS \ --password-stdin $ACCOUNT_ID.dkr.ecr.$REGION.amazonaws.com Error saving credentials: error storing credentials - err: exit status 1 out: 'Post "http://ipc/registry/credstore-updated": dial unix backend.sock: connect: no such file or directory'

要解决此问题,请确认 Docker 正在运行或打开 Docker 桌面。然后,尝试再次保存凭证。