本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Spark Operator 日志
执行 helm install 时,您可以按以下方式定义监控配置:
helm install spark-operator spark-operator \ --namespacenamespace\ --set emrContainers.awsRegion=aws_region\ --set emrContainers.monitoringConfiguration.image=log_agent_image_url\ --set emrContainers.monitoringConfiguration.s3MonitoringConfiguration.logUri=S3_bucket_uri\ --set emrContainers.monitoringConfiguration.cloudWatchMonitoringConfiguration.logGroupName=log_group_name\ --set emrContainers.monitoringConfiguration.cloudWatchMonitoringConfiguration.logStreamNamePrefix=log_stream_prefix\ --set emrContainers.monitoringConfiguration.sideCarResources.limits.cpuLimit=500m \ --set emrContainers.monitoringConfiguration.sideCarResources.limits.memoryLimit=512Mi \ --set emrContainers.monitoringConfiguration.containerLogRotationConfiguration.rotationSize=2GB \ --set emrContainers.monitoringConfiguration.containerLogRotationConfiguration.maxFilesToKeep=10 \ --set webhook.enable=true \ --set emrContainers.operatorExecutionRoleArn=operator_execution_role_arn
监控配置
以下是 monitoringConfiguration 下的可用配置选项。
图像(可选)- 日志代理图像 url。 emrReleaseLabel 如果未提供,将通过获取。
s3 MonitoringConfiguration — 将此选项设置为存档到 Amazon S3。
logUri:(必需):用来存储日志的 Amazon S3 存储桶路径。
以下是上传日志后 Amazon S3 存储桶路径的示例格式。第一个示例显示未启用日志轮换。
s3://${logUri}/${POD NAME}/operator/stdout.gz s3://${logUri}/${POD NAME}/operator/stderr.gz默认情况下,日志轮换处于启用状态。您可以看到一个轮换的文件(带有递增索引)和一个当前文件(与前一个示例相同)。
s3://${logUri}/${POD NAME}/operator/stdout_YYYYMMDD_index.gz s3://${logUri}/${POD NAME}/operator/stderr_YYYYMMDD_index.gz
cloudWatchMonitoring配置-用于设置转发的配置密钥 Amazon CloudWatch。
logGroupName(必填)-您要向其发送 Amazon CloudWatch 日志的日志组的名称。如果日志组不存在,则会自动创建。
logStreamName前缀(可选)-您要向其发送日志的日志流的名称。默认值是空字符串。中的格式如下 Amazon CloudWatch 所示:
${logStreamNamePrefix}/${POD NAME}/STDOUT or STDERR
sideCarResources(可选)— 用于在启动的 Fluentd sidecar 容器上设置资源限制的配置密钥。
memoryLimit(可选):内存限制。根据自身需求进行调整。默认值为 512Mi。
cpuLimit(可选):CPU 限制。根据自身需求进行调整。默认值为 500m。
containerLogRotation配置(可选)-控制容器日志的轮换行为。该功能默认已启用。
rotationSize(必需):指定日志轮换的文件大小。可行值的范围从 2KB 到 2GB 不等。rotationSize 参数的数字单位部分以整数形式传递。由于不支持十进制值,您可以指定 1.5GB 的轮换大小,例如值 1500MB。默认值为 2GB。
maxFilesToKee@@ p(必填)-指定轮换后要在容器中保留的最大文件数。最小值为 1,最大值为 50。默认值为 10。
配置 MonitoringC onfiguration 后,你应该能够查看 Amazon S3 存储桶 Amazon CloudWatch 或两者上的 spark 操作员容器日志。对于 Amazon S3 存储桶,需要等待 2 分钟才能刷新第一个日志文件。
要查找日志 Amazon CloudWatch,您可以导航到以下位置:CloudWatch> 日志组 > > /operator Pod name/st Log group namederr
或者你可以导航到:CloudWatch> 日志组 > > /operator Pod name/st Log group namedout