

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# Amazon EMR 上 Trino 的最佳实践
<a name="emr-trino-advanced"></a>

Trino 的架构专为跨多个数据来源对大型数据集运行快速分布式 SQL 查询而设计，其遵循协调器-工作线程模型，其中每个组件在查询执行中都有专门的角色。为了使运行 Trino 的 Amazon EMR 集群获得最佳性能，您可以重点关注以下几个领域或类别。这些功能包括：
+ 调整集群配置设置以优化内存。
+ 优化数据分区和数据分配的设置。
+ 使用动态筛选来减少查询结果计数。

当您将 Trino 与 Amazon EMR 结合使用时，其中一些设置会自动调整。其他设置可以通过控制台或 CLI 命令手动设置。本节中的主题可帮助您以最佳方式配置您的数据和集群。

**Topics**
+ [性能改进的关键重点领域](emr-trino-performance-areas.md)
+ [收集和利用表统计数据](emr-trino-performance-areas-collect-stats.md)
+ [扩展 Trino 工作负载时面临的常见挑战](emr-trino-common-issues.md)