

# Amazon Glue Spark 和 PySpark 作业
<a name="spark_and_pyspark"></a>

Amazon Glue 支持 Spark 和 PySpark 作业。Spark 任务会在由 Amazon Glue 托管的 Apache Spark 环境中执行。它将批量处理数据。流式处理 ETL 作业与 Spark 作业类似，只不过前者在数据流上执行 ETL。它使用 Apache Spark Structured Streaming 框架。某些 Spark 作业功能不可用于流式处理 ETL 作业。

以下几个部分提供有关 Amazon Glue Spark 和 PySpark 作业的信息。

**Topics**
+ [在 Amazon Glue 中为 Spark 作业配置作业属性](add-job.md)
+ [在 Amazon Glue 控制台中编辑 Spark 脚本](edit-script-spark.md)
+ [作业（旧版）](console-edit-script.md)
+ [使用作业书签跟踪已处理的数据](monitor-continuations.md)
+ [存储 Spark 随机排序数据](monitor-spark-shuffle-manager.md)
+ [监控 Amazon Glue Spark 作业](monitor-spark.md)
+ [Amazon 中 Apache Spark 的生成式人工智能故障排除](troubleshoot-spark.md)
+ [通过 Amazon Glue 使用实体化视图](materialized-views.md)