本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Amazon Glue API
本节介绍 Amazon Glue 软件开发工具包 (SDK) 和工具所使用的数据类型和原语。有三种通用方法可在 Amazon Glue 之外以编程方式与 Amazon Web Services Management Console 交互,每种方法都有自己的文档:
-
语言软件开发工具包 (SDK) 库允许您访问来自常用编程语言的 Amazon Web Services 资源。请在用于在 Amazon Web Services 上进行构建的工具
查找更多信息。 -
Amazon CLI 允许您访问来自命令行的 Amazon Web Services 资源。请在 Amazon CLI命令参考查找更多信息。
-
Amazon CloudFormation 允许您定义一组要一致地共同预调配的 Amazon Web Services 资源。请在 Amazon CloudFormation:Amazon Glue 资源类型参考查找更多信息。
本节记录了独立于这些软件开发工具包 (SDK) 和工具的共享原语。工具使用 Amazon Glue Web API 参考与 Amazon Web Services 通信。
目录
- Amazon Glue 中的安全性 API
- 数据类型
- DataCatalogEncryptionSettings 结构
- EncryptionAtRest 结构
- ConnectionPasswordEncryption 结构
- EncryptionConfiguration 结构
- S3Encryption 结构
- CloudWatchEncryption 结构
- JobBookmarksEncryption 结构
- SecurityConfiguration 结构
- GluePolicy 结构
- 操作
- GetDataCatalogEncryptionSettings 操作(Python:get_data_encryption_settings)
- PutDataCatalogEncryptionSettings 操作(Python:put_data_encryption_settings)
- PutResourcePolicy 操作(Python:put_rce_policy)
- GetResourcePolicy 操作(Python:get_rce_policy)
- DeleteResourcePolicy 操作(Python:delete_rce_policy)
- CreateSecurityConfiguration 操作(Python:create_security_con
- DeleteSecurityConfiguration 操作(Python:delete_security_config
- GetSecurityConfiguration 操作(Python:get_security_config
- GetSecurityConfigurations 操作(Python:get_security_config
- GetResourcePolicies 操作(Python:get_rce_policie)
- 目录 API
- 数据库 API
- 表 API
- 数据类型
- Table 结构
- TableInput 结构
- 列结构
- StorageDescriptor 结构
- SchemaReference 结构
- SerDeInfo 结构
- Order 结构
- SkewedInfo 结构
- TableVersion 结构
- TableError 结构
- TableVersionError 结构
- SortCriterion 结构
- TableIdentifier 结构
- KeySchemaElement 结构
- PartitionIndex 结构
- PartitionIndexDescriptor 结构
- BackfillError 结构
- 操作
- CreateTable 操作(Python:create_table)
- UpdateTable 操作(Python:uppate_table)
- DeleteTable 操作(Python:delete_table)
- BatchDeleteTable 操作(Python:batch_delete_table)
- GetTable 操作(Python:get_table)
- GetTables 操作(Python:get_tables)
- GetTableVersion 操作(Python:get_table_version)
- GetTableVersions 操作(Python:get_table_version)
- DeleteTableVersion 操作(Python:delete_table_version)
- BatchDeleteTableVersion 操作(Python:batch_delete_table_version)
- SearchTables 操作(Python:search_table)
- GetPartitionIndexes 操作(Python:get_partition_indexes)
- CreatePartitionIndex 操作(Python:创建_partition_index)
- DeletePartitionIndex 操作(Python:delete_partition_index)
- GetColumnStatisticsForTable 操作(Python:get_column_statistics_for_table)
- UpdateColumnStatisticsForTable 操作(Python:update_column_statistics)
- DeleteColumnStatisticsForTable 操作(Python:delete_column_statistics_for_table)
- 分区 API
- 数据类型
- Partition 结构
- PartitionInput 结构
- PartitionSpecWithSharedStorageDescriptor 结构
- PartitionListComposingSpec 结构
- PartitionSpecProxy 结构
- PartitionValueList 结构
- Segment 结构
- PartitionError 结构
- BatchUpdatePartitionFailureEntry 结构
- BatchUpdatePartitionRequestEntry 结构
- 操作
- CreatePartition 操作(Python:date_partiti
- BatchCreatePartition 操作(Python:batch_partition)
- UpdatePartition 操作(Python:date_partiti
- DeletePartition 操作(Python:delete_artition)
- BatchDeletePartition 操作(Python:batch_delete_partition)
- GetPartition 操作(Python:get_artition)
- GetPartitions 操作(Python:get_partition
- BatchGetPartition 操作(Python:batch_get_partition)
- BatchUpdatePartition 操作(Python:batch_update_partiti
- GetColumnStatisticsForPartition 操作(Python:get_column_statistics)
- UpdateColumnStatisticsForPartition 操作(Python:datistics_for_partition)
- DeleteColumnStatisticsForPartition 操作(Python:delete_column_statistics)
- 连接 API
- 数据类型
- Connection 结构
- ConnectionInput 结构
- PhysicalConnectionRequirements 结构
- GetConnectionsFilter 结构
- 操作
- CreateConnection 操作(Python:create_connec
- DeleteConnection 操作(Python:delete_connection
- GetConnection 操作(Python:get_connection
- GetConnections 操作(Python:get_connection
- UpdateConnection 操作(Python:Update_conn
- BatchDeleteConnection 操作(Python:batch_delete_connection)
- 用户定义的函数 API
- 数据类型
- UserDefinedFunction 结构
- UserDefinedFunctionInput 结构
- 操作
- CreateUserDefinedFunction 操作(Python:defined_function)
- UpdateUserDefinedFunction 操作(Python:date_user_defined_function)
- DeleteUserDefinedFunction 操作(Python:delete_user_defined_function)
- GetUserDefinedFunction 操作(Python:get_user_defined_function)
- GetUserDefinedFunctions 操作(Python:get_user_defined_functions)
- 将 Athena 目录导入 Amazon Glue
- 爬网程序和分类器 API
- 分类器 API
- 数据类型
- Classifier 结构
- GrokClassifier 结构
- XMLClassifier 结构
- JsonClassifier 结构
- CsvClassifier 结构
- CreateGrokClassifierRequest 结构
- UpdateGrokClassifierRequest 结构
- 创建 XMLClassifierRequest 结构
- 更新 XMLClassifierRequest 结构
- CreateJsonClassifierRequest 结构
- UpdateJsonClassifierRequest 结构
- CreateCsvClassifierRequest 结构
- UpdateCsvClassifierRequest 结构
- 操作
- CreateClassifier 操作(Python:create_clasifi
- DeleteClassifier 操作(Python:delete_clasififi
- GetClassifier 操作(Python:get_clasififi
- GetClassifiers 操作(Python:get_clasififi
- UpdateClassifier 操作(Python:update_classi
- 爬网程序 API
- 数据类型
- Crawler 结构
- Schedule 结构
- CrawlerTargets 结构
- S3Target 结构
- JdbcTarget 结构
- MongoDBTarget 结构
- DynamoDBTarget 结构
- DeltaTarget 结构
- CatalogTarget 结构
- CrawlerMetrics 结构
- CrawlerHistory 结构
- CrawlsFilter 结构
- SchemaChangePolicy 结构
- LastCrawlInfo 结构
- RecrawlPolicy 结构
- LineageConfiguration 结构
- LakeFormationConfiguration 结构
- 操作
- CreateCrawler 操作(Python:create_crawler)
- DeleteCrawler 操作(Python:delete_crawler)
- GetCrawler 操作(Python:get_crawler)
- GetCrawlers 操作(Python:get_crawlers)
- GetCrawlerMetrics 操作(Python:get_crawler_metrics)
- UpdateCrawler 操作(Python:update_crawler
- StartCrawler 操作(Python:startratler)
- StopCrawler 操作(Python:stop_crawler)
- BatchGetCrawlers 操作(Python:batch_get_crawlers)
- ListCrawlers 操作(Python:list_crawlers)
- ListCrawls 操作(Python:list_crawls)
- 爬网程序计划程序 API
- 分类器 API
- 自动生成 ETL 脚本 API
- 可视化作业 API
- 数据类型
- CodeGenConfigurationNode 结构
- JDBCConnectorOptions 结构
- StreamingDataPreviewOptions 结构
- AthenaConnectorSource 结构
- JDBCConnectorSource 结构
- SparkConnectorSource 结构
- CatalogSource 结构
- MySQCatalogSource L
- PostgreSQLCatalogSource 结构
- OracleSQLCatalogSource 结构
- MicrosoftSQLServerCatalogSource 结构
- CatalogKinesisSource 结构
- DirectKinesisSource 结构
- KinesisStreamingSourceOptions 结构
- CatalogKafkaSource 结构
- DirectKafkaSource 结构
- KafkaStreamingSourceOptions 结构
- RedshiftSource 结构
- S3CatalogSource 结构
- S3SourceAdditionalOptions 结构
- S3CsvSource 结构
- DirectJDBCSource 结构
- S3DirectSourceAdditionalOptions 结构
- S3JsonSource 结构
- S3ParquetSource 结构
- DynamoDBCatalogSource 结构
- RelationalCatalogSource 结构
- JDBCConnectorTarget 结构
- SparkConnectorTarget 结构
- BasicCatalogTarget 结构
- MySQCatalogTarget L
- PostgreSQLCatalogTarget 结构
- OracleSQLCatalogTarget 结构
- MicrosoftSQLServerCatalogTarget 结构
- RedshiftTarget 结构
- UpsertRedshiftTargetOptions 结构
- S3CatalogTarget 结构
- S3GlueParquetTarget 结构
- CatalogSchemaChangePolicy 结构
- S3DirectTarget 结构
- DirectSchemaChangePolicy 结构
- ApplyMapping 结构
- Mapping 结构
- SelectFields 结构
- DropFields 结构
- RenameField 结构
- Spigot 结构
- Join 结构
- JoinColumn 结构
- SplitFields 结构
- SelectFromCollection 结构
- FillMissingValues 结构
- Filter 结构
- FilterExpression 结构
- FilterValue 结构
- CustomCode 结构
- SparkSQL 结构
- SqlAlias 结构
- DropNullFields 结构
- NullCheckBoxList 结构
- NullValueField 结构
- Datatype 结构
- Merge 结构
- Union 结构
- PIIDetection 结构
- Aggregate 结构
- DropDuplicates 结构
- GovernedCatalogTarget 结构
- GovernedCatalogSource 结构
- AggregateOperation 结构
- GlueSchema 结构
- GlueStudioSchemaColumn 结构
- GlueStudioColumn 结构
- DynamicTransform 结构
- TransformConfigParameter 结构
- EvaluateDataQuality 结构
- S3CatalogHudiSource 结构
- CatalogHudiSource 结构
- S3HudiSource 结构
- S3HudiCatalogTarget 结构
- S3HudiDirectTarget 结构
- DQResultsPublishingOptions 结构
- DQStopJobOnFailureOptions 结构
- 作业 API
- 任务
- 数据类型
- Job 结构
- ExecutionProperty 结构
- NotificationProperty 结构
- JobCommand 结构
- ConnectionsList 结构
- JobUpdate 结构
- SourceControlDetails 结构
- 操作
- CreateJob 操作(Python:create_job)
- UpdateJob 操作(Python:job)
- GetJob 操作(Python:get_job)
- GetJobs 操作(Python:get_jobs)
- DeleteJob 操作(Python:delete_job)
- ListJobs 操作(Python:list_jobs)
- BatchGetJobs 操作(Python:batch_get_jobs)
- UpdateSourceControlFromJob 操作(Python:update_source_control_from
- UpdateJobFromSourceControl 操作(Python:update_job_from_control)
- 任务运行
- 数据类型
- JobRun 结构
- Predecessor 结构
- JobBookmarkEntry 结构
- BatchStopJobRunSuccessfulSubmission 结构
- BatchStopJobRunError 结构
- 操作
- StartJobRun 操作(Python:start_job_run)
- BatchStopJobRun 操作(Python:batch_job_run)
- GetJobRun 操作(Python:get_job_run)
- GetJobRuns 操作(Python:get_job_runs)
- GetJobBookmark 操作(Python:get_bookmark)
- GetJobBookmarks 操作(Python:get_bookmarks)
- ResetJobBookmark 操作(Python:reset_bookmark)
- 触发
- 数据类型
- Trigger 结构
- TriggerUpdate 结构
- Predicate 结构
- Condition 结构
- Action 结构
- EventBatchingCondition 结构
- 操作
- CreateTrigger 操作(Python:create_triger
- StartTrigger 操作(Python:start_triger)
- GetTrigger 操作(Python:get_trigers)
- GetTriggers 操作(Python:get_trigers)
- UpdateTrigger 操作(Python:update_trig
- StopTrigger 操作(Python:stop_triger)
- DeleteTrigger 操作(Python:delete_trigers)
- ListTriggers 操作(Python:list_trigers)
- BatchGetTriggers 操作(Python:batch_get_trigers)
- 任务
- 交互式会话 API
- 数据类型
- Session 结构
- SessionCommand 结构
- Statement 结构
- StatementOutput 结构
- StatementOutputData 结构
- 操作
- CreateSession 操作(Python:create_sion)
- StopSession 操作(Python:stop_sion)
- DeleteSession 操作(Python:delete_session)
- GetSession 操作(Python:get_session)
- ListSessions 操作(Python:st_ession)
- RunStatement (Python:run_statement)
- CancelStatement 操作(Python:cancel_statem
- GetStatement 操作(Python:get_statement
- ListStatements 操作(Python:st_statement)
- 开发终端节点 API
- 数据类型
- DevEndpoint 结构
- DevEndpointCustomLibraries 结构
- 操作
- CreateDevEndpoint 操作(Python:dev_endpoint)
- UpdateDevEndpoint 操作(Python:dev_endpoint)
- DeleteDevEndpoint 操作(Python:dev_endpoint)
- GetDevEndpoint 操作(Python:get_dev_dpoint)
- GetDevEndpoints 操作(Python:get_dev_dpoints
- BatchGetDevEndpoints 操作(Python:batch_get_dev_endpoints)
- ListDevEndpoints 操作(Python:list_dpoints)
- 架构注册表
- 数据类型
- RegistryId 结构
- RegistryListItem 结构
- MetadataInfo 结构
- OtherMetadataValueListItem 结构
- SchemaListItem 结构
- SchemaVersionListItem 结构
- MetadataKeyValuePair 结构
- SchemaVersionErrorItem 结构
- ErrorDetails 结构
- SchemaVersionNumber 结构
- SchemaId 结构
- 操作
- CreateRegistry 操作(Python:registry)
- CreateSchema 操作(Python:create_meta)
- GetSchema 操作(Python:get_schema)
- ListSchemaVersions 操作(Python:list_schema_versions)
- GetSchemaVersion 操作(Python:get_schema_version)
- GetSchemaVersionsDiff 操作(Python:get_schema_version_diff)
- ListRegistries 操作(Python:list_registry)
- ListSchemas 操作(Python:list_schema)
- RegisterSchemaVersion 操作(Python:register_schema_version)
- UpdateSchema 操作(Python:update_sche
- CheckSchemaVersionValidity 操作(Python:chema_version_validity)
- UpdateRegistry 操作(Python:update_regi
- GetSchemaByDefinition 操作(Python:get_schema_by_definition)
- GetRegistry 操作(Python:get_registry
- PutSchemaVersionMetadata 操作(Python:put_table_metadata)
- QuerySchemaVersionMetadata 操作(Python:query_table_metadata)
- RemoveSchemaVersionMetadata 操作(Python:remo _schema_version_metadata)
- DeleteRegistry 操作(Python:dete_registry)
- DeleteSchema 操作(Python:delete_schema)
- DeleteSchemaVersions 操作(Python:delete_schema_versions)
- 工作流程
- 数据类型
- JobNodeDetails 结构
- CrawlerNodeDetails 结构
- TriggerNodeDetails 结构
- Crawl 结构
- Node 结构
- Edge 结构
- Workflow 结构
- WorkflowGraph 结构
- WorkflowRun 结构
- WorkflowRunStatistics 结构
- StartingEventBatchCondition 结构
- Blueprint 结构
- BlueprintDetails 结构
- LastActiveDefinition 结构
- BlueprintRun 结构
- 操作
- CreateWorkflow 操作(Python:create_workf
- UpdateWorkflow 操作(Python:update_work
- DeleteWorkflow 操作(Python:delete_workflow
- GetWorkflow 操作(Python:get_workflow
- ListWorkflows 操作(Python:lows)
- BatchGetWorkflows 操作(Python:batch_get_workflows)
- GetWorkflowRun 操作(Python:get_workflow_run)
- GetWorkflowRuns 操作(Python:get_workflow_runs)
- GetWorkflowRunProperties 操作(Python:get_workflow_properties)
- PutWorkflowRunProperties 操作(Python:put_workflow_properties)
- CreateBlueprint 操作(Python:create_blint
- UpdateBlueprint 操作(Python:update_blin
- DeleteBlueprint 操作(Python:delete_blint)
- ListBlueprints 操作(Python:list_blint)
- BatchGetBlueprints 操作(Python:batch_get_blueprints)
- StartBlueprintRun 操作(Python:start_blueprint)
- GetBlueprintRun 操作(Python:get_blueprint)
- GetBlueprintRuns 操作(Python:get_blint_runs)
- StartWorkflowRun 操作(Python:start_workflow_run)
- StopWorkflowRun 操作(Python:stop_workflow_run)
- ResumeWorkflowRun 操作(Python:resume_workflow_run)
- 机器学习 API
- 数据类型
- TransformParameters 结构
- EvaluationMetrics 结构
- MLTransform 结构
- FindMatchesParameters 结构
- FindMatchesMetrics 结构
- ConfusionMatrix 结构
- GlueTable 结构
- TaskRun 结构
- TransformFilterCriteria 结构
- TransformSortCriteria 结构
- TaskRunFilterCriteria 结构
- TaskRunSortCriteria 结构
- TaskRunProperties 结构
- FindMatchesTaskRunProperties 结构
- ImportLabelsTaskRunProperties 结构
- ExportLabelsTaskRunProperties 结构
- LabelingSetGenerationTaskRunProperties 结构
- SchemaColumn 结构
- TransformEncryption 结构
- 机器学习UserDataEncryption 结构
- ColumnImportance 结构
- 操作
- CreateMLTransform 操作(Python:create_ml_transform)
- UpdateMLTransform 操作(Python:update_ml_transform)
- DeleteMLTransform 操作(Python:delete_ml_transform)
- GetMLTransform 操作(Python:get_ml_transform)
- GetMLTransforms 操作(Python:get_ml_ransforms)
- ListMLTransforms 操作(Python:list_ml_transforms)
- StartMLEvaluationTaskRun 操作(Python:start_ml_evaluation_task_r
- StartMLLabelingSetGenerationTaskRun 操作(Python:start_ml_labeling_set_generation_task_run
- GetMLTaskRun 操作(Python:get_ml_task_run)
- GetMLTaskRuns 操作(Python:get_ml_task_runs)
- CancelMLTaskRun 操作(Python:cancel_ml_task_run
- StartExportLabelsTaskRun 操作(Python:start_export_labels_task_run)
- StartImportLabelsTaskRun 操作(Python:start_import_labels_task_run)
- 数据质量 API
- 数据类型
- DataSource 结构
- DataQualityRulesetListDetails 结构
- DataQualityTargetTable 结构
- DataQualityRulesetEvaluationRunDescription 结构
- DataQualityRulesetEvaluationRunFilter 结构
- DataQualityEvaluationRunAdditionalRunOptions 结构
- DataQualityRuleRecommendationRunDescription 结构
- DataQualityRuleRecommendationRunFilter 结构
- DataQualityResult 结构
- DataQualityRuleResult 结构
- DataQualityResultDescription 结构
- DataQualityResultFilterCriteria 结构
- DataQualityRulesetFilterCriteria 结构
- 操作
- StartDataQualityRulesetEvaluationRun 操作(Python:start_data_quality_run)
- CancelDataQualityRulesetEvaluationRun 操作(Python:cancel_data_quality_run)
- GetDataQualityRulesetEvaluationRun 操作(Python:get_data_quality_run)
- ListDataQualityRulesetEvaluationRuns 操作(Python:list_data_quality_runs)
- StartDataQualityRuleRecommendationRun 操作(Python:start_data_quality_run)
- CancelDataQualityRuleRecommendationRun 操作(Python:cancel_data_quality_run)
- GetDataQualityRuleRecommendationRun 操作(Python:get_data_quality_run)
- ListDataQualityRuleRecommendationRuns 操作(Python:list_data_quality_runs)
- GetDataQualityResult 操作(Python:获取_data_quality_result
- BatchGetDataQualityResult 操作(Python:batch_get_data_quality_result)
- ListDataQualityResults 操作(Python:列表_数据_quality_results)
- CreateDataQualityRuleset 操作(Python:创建_data_quality_ruleset)
- DeleteDataQualityRuleset 操作(Python:delete_data_quality_ruleset
- GetDataQualityRuleset 操作(Python:get_data_quality_reset)
- ListDataQualityRulesets 操作(Python:list_data_quality_rulesets
- UpdateDataQualityRuleset 操作(Python:updata_quality_ruleset)
- 敏感数据检测 API
- 在 Amazon Glue Studio 外部使用敏感数据检测
- 数据类型
- CustomEntityType 结构
- 操作
- CreateCustomEntityType 操作(Python:创建_custom_entity_type)
- DeleteCustomEntityType 操作(Python:delete_custom_entity_type)
- GetCustomEntityType 操作(Python:get_custom_entity_type)
- BatchGetCustomEntityTypes 操作(Python:batch_get_ustom_entity_type)
- ListCustomEntityTypes 操作(Python:list_custom_entity_type)
- Amazon Glue 中的标记 API
- 常见数据类型
- Tag 结构
- DecimalNumber 结构
- ErrorDetail 结构
- PropertyPredicate 结构
- ResourceUri 结构
- ColumnStatistics 结构
- ColumnStatisticsError 结构
- ColumnError 结构
- ColumnStatisticsData 结构
- BooleanColumnStatisticsData 结构
- DateColumnStatisticsData 结构
- DecimalColumnStatisticsData 结构
- DoubleColumnStatisticsData 结构
- LongColumnStatisticsData 结构
- StringColumnStatisticsData 结构
- BinaryColumnStatisticsData 结构
- 字符串模式
- 异常
- AccessDeniedException 结构
- AlreadyExistsException 结构
- ConcurrentModificationException 结构
- ConcurrentRunsExceededException 结构
- CrawlerNotRunningException 结构
- CrawlerRunningException 结构
- CrawlerStoppingException 结构
- EntityNotFoundException 结构
- GlueEncryptionException 结构
- IdempotentParameterMismatchException 结构
- IllegalWorkflowStateException 结构
- InternalServiceException 结构
- InvalidExecutionEngineException 结构
- InvalidInputException 结构
- InvalidStateException 结构
- InvalidTaskStatusTransitionException 结构
- JobDefinitionErrorException 结构
- JobRunInTerminalStateException 结构
- JobRunInvalidStateTransitionException 结构
- JobRunNotInTerminalStateException 结构
- LateRunnerException 结构
- NoScheduleException 结构
- OperationTimeoutException 结构
- ResourceNotReadyException 结构
- ResourceNumberLimitExceededException 结构
- SchedulerNotRunningException 结构
- SchedulerRunningException 结构
- SchedulerTransitioningException 结构
- UnrecognizedRunnerException 结构
- ValidationException 结构
- VersionMismatchException 结构