Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅
中国的 Amazon Web Services 服务入门
(PDF)。
启用目录级别自动统计数据生成
您可以为 Data Catalog 中所有新的 Apache Iceberg 表和非 OTF 表(Parquet、JSON、CSV、XML、ORC、ION)格式的表启用自动列统计数据生成。创建表后,您还可以手动显式更新列统计数据设置。
要更新 Data Catalog 设置以启用目录级别,使用的 IAM 角色必须对根目录具有 glue:UpdateCatalog
权限或 Amazon Lake Formation ALTER CATALOG
权限。您可以使用 GetCatalog
API 来验证目录属性。
- Amazon Web Services Management Console
-
- Amazon CLI
-
您也可以通过 Amazon CLI 启用目录级别统计数据收集。要使用 Amazon CLI 配置表级统计数据收集,请运行下面的命令:
aws glue update-catalog --cli-input-json '{
"name": "123456789012"
,
"catalogInput": {
"description": "Updating root catalog with role arn",
"catalogProperties": {
"customProperties": {
"ColumnStatistics.RoleArn": "arn:aws:iam::"123456789012"
:role/service-role/AWSGlueServiceRole",
"ColumnStatistics.Enabled": "true"
}
}
}
}'
上面的命令调用 Amazon Glue 的 UpdateCatalog
操作,它采用具有以下键值对的 CatalogProperties
结构生成目录级别统计数据: