Spark 操作员日志 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Spark 操作员日志

执行此操作时,您可以通过以下方式定义监控配置helm install

helm install spark-operator spark-operator \ --namespace namespace \ --set emrContainers.awsRegion=aws_region \ --set emrContainers.monitoringConfiguration.image=log_agent_image_url \ --set emrContainers.monitoringConfiguration.s3MonitoringConfiguration.logUri=S3_bucket_uri \ --set emrContainers.monitoringConfiguration.cloudWatchMonitoringConfiguration.logGroupName=log_group_name \ --set emrContainers.monitoringConfiguration.cloudWatchMonitoringConfiguration.logStreamNamePrefix=log_stream_prefix \ --set emrContainers.monitoringConfiguration.sideCarResources.limits.cpuLimit=500m \ --set emrContainers.monitoringConfiguration.sideCarResources.limits.memoryLimit=512Mi \ --set emrContainers.monitoringConfiguration.containerLogRotationConfiguration.rotationSize=2GB \ --set emrContainers.monitoringConfiguration.containerLogRotationConfiguration.maxFilesToKeep=10 \ --set webhook.enable=true \ --set emrContainers.operatorExecutionRoleArn=operator_execution_role_arn

监控配置

以下是 “监控配置” 下的可用配置选项。

  • 图片(可选)-日志代理图像网址。 emrReleaseLabel 如果未提供,将通过获取。

  • s3 MonitoringConfiguration — 将此选项设置为存档到 Amazon S3。

    • LogURI —(必填)— 您要存储日志的 Amazon S3 存储桶路径。

    • 以下是上传日志后 Amazon S3 存储桶路径的示例格式。第一个示例显示未启用日志轮换。

      s3://${logUri}/${POD NAME}/operator/stdout.gz s3://${logUri}/${POD NAME}/operator/stderr.gz

      默认情况下,日志轮换处于启用状态。您既可以看到带有递增索引的旋转文件,也可以看到与前一个示例相同的当前文件。

      s3://${logUri}/${POD NAME}/operator/stdout_YYYYMMDD_index.gz s3://${logUri}/${POD NAME}/operator/stderr_YYYYMMDD_index.gz
  • cloudWatchMonitoring配置-用于设置转发的配置密钥 Amazon CloudWatch。

    • logGroupName(必填)-您要向其发送 Amazon CloudWatch 日志的日志组的名称。如果日志组不存在,则会自动创建。

    • logStreamName前缀(可选)-您要向其发送日志的日志流的名称。默认值是空字符串。中的格式如下 Amazon CloudWatch 所示:

      ${logStreamNamePrefix}/${POD NAME}/STDOUT or STDERR
  • sideCarResources(可选)— 用于在启动的 Fluentd sidecar 容器上设置资源限制的配置密钥。

    • MemoryLimit(可选)-内存限制。根据自身需求进行调整。默认值为 512Mi。

    • CPULimit(可选)— CPU 限制。根据自身需求进行调整。默认值为 500 米。

  • containerLogRotation配置(可选)-控制容器日志的轮换行为。该功能默认已启用。

    • rotationSiz e(必填)-指定日志轮换的文件大小。可行值的范围从 2KB 到 2GB 不等。rotationSize 参数的数字单位部分以整数形式传递。由于不支持十进制值,您可以指定 1.5GB 的轮换大小,例如值 1500MB。默认值为 2GB。

    • maxFilesToKee@@ p(必填)-指定轮换后要在容器中保留的最大文件数。最小值为 1,最大值为 50。默认值为 10。

配置 MonitoringC onfiguration 后,你应该能够在 Amazon S3 存储桶 Amazon CloudWatch 或两者上查看 spark 操作员容器日志。对于 Amazon S3 存储桶,您需要等待 2 分钟才能刷新第一个日志文件。

要查找日志 Amazon CloudWatch,您可以导航到以下位置:CloudWatch> 日志组 > > /operator Pod name/st Log group namederr

或者你可以导航到:CloudWatch> 日志组 > > /operator Pod name/st Log group namedout