Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅
中国的 Amazon Web Services 服务入门
(PDF)。
管理列统计数据生成计划
您可以在中管理计划操作,例如更新、启动、停止和删除列统计信息生成的计划 Amazon Glue。您可以使用 Amazon Glue
控制台 Amazon CLI、或Amazon Glue 列统计信息API操作来执行这些任务。
更新列统计数据生成计划
创建列统计信息生成任务后,您可以更新计划以触发该任务。您可以使用 Amazon Glue 控制台 Amazon CLI、或运行UpdateColumnStatisticsTaskSettings操作来更新表的计划。您可以修改现有计划的参数,例如计划类型(按需或计划)和其他可选参数。
- Amazon Web Services Management Console
- Amazon CLI
-
如果您没有在控制台中使用 Amazon Glue统计信息生成功能,则可以使用update-column-statistics-task-settings
命令手动更新计划。以下示例演示了如何使用 Amazon CLI更新列统计数据。
aws glue update-column-statistics-task-settings \
--database-name 'database_name
' \
--table-name 'table_name
' \
--role arn:aws:iam::123456789012
:role/stats_role
\
--schedule 'cron(0 0-5 16 * * ?)
' \
--column-name-list 'col-1
' \
--sample-size '20.0
' \
--catalog-id '123456789012
'\
--security-configuration 'test-security
'
停止列统计数据生成计划
如果您不再需要增量统计信息,则可以停止计划生成,以节省资源和成本。暂停计划不会影响之前生成的统计数据。您可以在方便的时候恢复日程安排。
- Amazon Web Services Management Console
停止列统计数据生成任务的计划
在 Amazon Glue 控制台上,选择数据目录下的表。
选择包含列统计数据的表。
在表详细信息页面上,选择列统计数据。
在 “操作” 下,选择 “计划生成”、“暂停”。
选择 “暂停” 进行确认。
- Amazon CLI
-
要使用停止列统计任务的运行计划 Amazon CLI,可以使用以下命令:
aws glue stop-column-statistics-task-run-schedule \
--database-name ''database_name
' \
--table-name 'table_name
'
将database_name
和替换为要停止列统计任务运行计划的数据库和表的实际名称。table_name
恢复生成列统计信息的计划
如果您已暂停统计数据生成计划,则 Amazon Glue 允许您在方便时恢复该计划。您可以使用 Amazon Glue
控制台 Amazon CLI、或StartColumnStatisticsTaskRunSchedule操作来恢复日程安排。
- Amazon Web Services Management Console
恢复列统计数据生成计划
在 Amazon Glue 控制台上,选择数据目录下的表。
选择包含列统计数据的表。
在表详细信息页面上,选择列统计数据。
在 “操作” 下,选择 “计划生成”,然后选择 “恢复”。
选择 “恢复” 进行确认。
- Amazon CLI
-
将database_name
和替换为要停止列统计任务运行计划的数据库和表的实际名称。table_name
aws glue start-column-statistics-task-run-schedule \
--database-name 'database_name
' \
--table-name 'table_name
'
删除列统计数据生成计划
虽然通常建议维护 up-to-date统计数据以获得最佳查询性能,但在某些特定的用例中,删除自动生成计划可能会有所帮助。
- Amazon Web Services Management Console
删除列统计数据生成计划
在 Amazon Glue 控制台上,选择数据目录下的表。
选择包含列统计数据的表。
在表详细信息页面上,选择列统计数据。
在 “操作” 下,选择 “计划生成”、“删除”。
选择 “删除” 进行确认。
- Amazon CLI
-
将database_name
和替换为要停止列统计任务运行计划的数据库和表的实际名称。table_name
您可以使用DeleteColumnStatisticsTaskSettingsAPI操作或删除列统计计划 Amazon CLI。以下示例说明如何使用 Amazon Command Line Interface (Amazon CLI) 删除生成列统计信息的计划。
aws glue delete-column-statistics-task-settings \
--database-name 'database_name
' \
--table-name 'table_name
'