使用带有 Iceberg 和 Amazon Glue 数据目录集成的 Redshift 托管存储 (RMS)将 Redshift 托管存储 (RMS) 与 Iceberg REST API 和 Glue 数据目录配合使用 Amazon

在 EMR Serv Amazon erless 上使用 Glue 多目录层次结构

您可以将 EMR 无服务器应用程序配置为使用 Glue 多目录层次结构 Amazon 。以下示例说明如何在 Glue 多目录层次结构中 Amazon 使用 EMR-S Spark。

要了解有关多目录层次结构的更多信息，请参阅 Amazon EMR 上的 G Amazon lue 数据目录中使用 Spark 处理多目录层次结构。

使用带有 Iceberg 和 Glue 数据目录的 Redshift 托管存储 (RMS) Amazon

以下内容演示了如何配置 Spark 以与 Iceberg 的 Amazon Glue 数据目录集成：


aws emr-serverless start-job-run \
    --application-id application-id \
    --execution-role-arn job-role-arn \
    --job-driver '{
        "sparkSubmit": {
            "entryPoint": "s3://amzn-s3-demo-bucket/myscript.py",
            "sparkSubmitParameters": "--conf spark.sql.catalog.nfgac_rms = org.apache.iceberg.spark.SparkCatalog
             --conf spark.sql.catalog.rms.type=glue 
             --conf spark.sql.catalog.rms.glue.id=Glue RMS catalog ID 
             --conf spark.sql.defaultCatalog=rms
             --conf spark.sql.extensions=org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions"
        }
    }'

集成后来自目录中的表的查询示例：


SELECT * FROM my_rms_schema.my_table

将 Redshift 托管存储 (RMS) 与 Iceberg REST API 和 Glue 数据目录配合使用 Amazon

以下内容展示了如何将 Spark 配置为与 Iceberg REST 目录配合使用：


aws emr-serverless start-job-run \
--application-id application-id \
--execution-role-arn job-role-arn \
--job-driver '{
"sparkSubmit": {
"entryPoint": "s3://amzn-s3-demo-bucket/myscript.py",
    "sparkSubmitParameters": "
    --conf spark.sql.catalog.rms=org.apache.iceberg.spark.SparkCatalog
    --conf spark.sql.catalog.rms.type=rest
    --conf spark.sql.catalog.rms.warehouse=Glue RMS catalog ID
    --conf spark.sql.catalog.rms.uri=Glue endpoint URI/iceberg
    --conf spark.sql.catalog.rms.rest.sigv4-enabled=true
    --conf spark.sql.catalog.rms.rest.signing-name=glue
    --conf spark.sql.extensions=org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions"
    }
  }'

来自目录中的表的查询示例：


SELECT * FROM my_rms_schema.my_table

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

使用外部 Hive 元存储

使用外部元存储时的注意事项