创建和管理 Amazon Elasticsearch Service 域 - Amazon Elasticsearch Service
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建和管理 Amazon Elasticsearch Service 域

本章介绍如何创建和管理 Amazon Elasticsearch Service (Amazon ES) 域。亚马逊 ES 域是弹性搜索集群的同义词。域是包含您指定的设置、实例类型、实例计数和存储资源的群集。

入门教程中的简短说明不同,本章描述了所有选项,并提供了相关的参考信息。您可以使用 Amazon ES 控制台的说明、Amazon Command Line Interface(Amazon CLI),或Amazon开发工具包。

创建 Amazon ES 域

本部分介绍如何使用 Amazon ES 控制台或使用Amazon CLI使用create-elasticsearch-domain命令。

创建亚马逊 ES 域(控制台)

使用以下步骤使用控制台创建 Amazon ES 域。

创建 Amazon ES 域(控制台)

  1. 转至 https://aws.amazon.com,然后选择 Sign In to the Console (登录控制台)

  2. Analytics 下,选择 Elasticsearch Service

  3. 选择 Create a new domain (创建新域)

  4. 对于 Choose deployment type (选择部署类型),选择与您的域的目的最匹配的选项:

    • Production (生产) 域使用多可用区和专用主节点来实现更高的可用性。

    • Development and testing (开发和测试) 域使用单个可用区。

    • Custom (自定义) 域能让您从所有配置选项中进行选择。

    重要

    不同部署类型在后续页面上显示不同的选项。这些步骤包括所有选项(Custom (自定义) 部署类型)。

  5. 对于 Elasticsearch version (Elasticsearch 版本),建议您选择最新版本。有关更多信息,请参阅支持的 Elasticsearch 版本

  6. 选择 Next

  7. 对于 Elasticsearch domain name (Elasticsearch 域名),请输入域名。名称必须符合以下标准:

    • 对于您的账户和区域而言是唯一的

    • 以小写字母开头

    • 包含 3 到 28 个字符

    • 只包含小写字母 a-z、数字 0-9 和连字符 (-)

  8. 如果您想使用自定义端点,而不是https://search-mydomain-1a2a3a4a5a6a7a8a9a0a9a8a7a.us-east-1.es.amazonaws.com中,选择启用自定义终端节点。然后提供名称和证书。有关更多信息,请参阅为 Amazon Elasticsearch Service 创建自定义终端节点节点

  9. 对于 Availability Zones (可用区),选择 1-AZ2-AZ3-AZ。有关更多信息,请参阅在 Amazon Elasticsearch Service 中配置多可用区域

  10. 对于 Instance type,为数据节点选择实例类型。有关更多信息,请参阅 。Amazon Elasticsearch Service 中支持的实例类型

    注意

    并非所有可用区都支持所有实例类型。如果您选择 3-AZ,我们建议您选择最新一代实例类型,如 R5 或 I3。

  11. 对于 Number of nodes (节点数),选择数据节点数。

    有关最大值,请参阅群集和实例限制。单节点集群适合开发和测试,但不应用于生产工作负载。有关更多指导,请参阅调整 Amazon Elasticsearch Service 域大小在 Amazon Elasticsearch Service 中配置多可用区域

  12. 对于 Data nodes storage type (数据节点存储类型),选择 Instance (实例)(默认)或 EBS

    有关创建超大型域的指南,请参阅 PB 规模。如果您选择 EBS,下列选项将会出现:

    1. 对于 EBS volume type (EBS 卷类型),选择一个 EBS 卷类型。

      如果您选择 Provisioned IOPS (SSD) (预配置 IOPS (SSD)) 作为 EBS 卷类型,则对于 Provisioned IOPS (预配置 IOPS),请输入所需的基准 IOPS 性能。有关更多信息,请参阅 。Amazon EBS 卷在 Amazon EC2 文档中。

    2. 对于 EBS storage size per node (每个节点的 EBS 卷大小),请输入要附加到每个数据节点的 EBS 卷的大小。

      EBS volume size (EBS 卷大小) 是按节点计算的。您可以通过将数据节点数乘以 EBS 卷大小来计算 Amazon ES 域的总集群大小。EBS 卷最小容量和最大容量取决于指定的 EBS 卷类型及其挂载到的实例类型。要了解更多信息,请参阅 EBS 卷大小限制

  13. (可选)启用或禁用专用主节点。专用主节点可增强集群稳定性,对于包含 10 个以上实例的域而言是必需的。对于生产域,我们建议使用 3 个专用主节点。

    注意

    对于专用主节点和数据节点,可以选择不同的实例类型。例如,您可以为数据节点选择通用或存储优化实例,但为专用主节点选择计算优化实例。

  14. (可选)要启用 UltraWarm 存储,请选择 Enable UltraWarm data nodes (启用 UltraWarm 数据节点)。每种实例类型都有其可处理的最大存储量。将该数量乘以总可寻址温存储的温数据节点数。

  15. (可选)启用冷存储中,选择启用冷存储。您必须启用 UltraWarm 才能启用冷存储。

  16. (可选)对于运行 Elasticsearch 5.3 及更高版本的域,自动快照开始时间无效。有关自动制作快照的更多信息,请参阅在 Amazon Elasticsearch Service 中创建索引快照

  17. (可选)选择 Optional Elasticsearch cluster settings (可选 Elasticsearch 集群设置)。有关这些选项的摘要,请参阅高级选项

  18. 选择 Next

  19. Network configuration (网络配置) 部分中,选择 VPC Access (VPC 访问权限)Public access (公有访问权限)。如果您选择 Public access (公有访问权限),请跳至下一步。如果选择 VPC access (VPC 访问权限),则确保您满足先决条件,然后执行下列操作:

    1. 对于 VPC,选择要使用的 VPC 的 ID。

      注意

      VPC 和域必须位于同一 Amazon 区域中,并且您必须选择具有设置为 Default 的租赁的 VPC。Amazon ES 尚不支持使用专用租赁的 VPC。

    2. 对于 Subnet (子网),选择一个子网。如果您启用多 AZ,您必须选择两个或三个子网。亚马逊 ES 将放置 VPC 终端节点,弹性网络接口在子网中。

      注意

      必须在子网中为网络接口预留足够的 IP 地址。有关更多信息,请参阅 。在 VPC 子网中预留 IP 地址

    3. 适用于安全组中,选择一个或多个 VPC 安全组,以允许您所需的应用程序在域公开的端口(80 或 443)和协议(HTTP 或 HTTP)上访问 Amazon ES 域。有关更多信息,请参阅在 VPC 中启动您的 Amazon Elasticsearch Service 域

    4. 适用于IAM 角色,保留默认角色。Amazon ES 使用此预定义角色(也称为服务相关角色)访问您的 VPC 并将 VPC 终端节点和网络接口放入 VPC 的子网中。有关更多信息,请参阅 。VPC 访问的服务相关角色

  20. Fine-grained access control (精细访问控制) 部分中,启用或禁用精细访问控制:

    • 如果要使用 IAM 进行用户管理,请选择 Set IAM role as master user (将 IAM 角色设置为主用户),然后为 IAM 角色指定 ARN。

    • 如果要使用内部用户数据库,请选择创建主用户并指定用户名和密码。

    无论您选择哪个选项,主用户都可以访问集群中的所有索引和所有 Elasticsearch API。有关选择哪个选项的指南,请参阅重要概念

    如果您禁用精细访问控制,则仍可以通过将域放置在 VPC 中并/或应用限制性访问策略来控制对域的访问。您必须启用节点到节点加密和静态加密才能使用精细访问控制。

    注意

    我们强烈建议您启用精细访问控制以保护域上的数据。精细访问控制提供群集、索引、文档和字段级别的安全性。

  21. (可选)如果要对 Kibana 使用 SAML 身份验证,请选择准备 SAML 身份验证。域可用之后,请参阅用于 Kibana 的 SAML 身份验证了解其他步骤。

  22. (可选)如果要对 Kibana 使用 Amazon Cognito 身份验证,请选择启用 Amazon Cognito 身份验证

    1. 选择想要用于 Kibana 身份验证的 Amazon Cognito 用户池和身份池。有关创建这些资源的指南,请参阅配置用于 Kibana 的 Amazon Cognito 身份验证

  23. 对于 Domain access policy (域访问策略),添加所需的 ARN 或 IP 地址,或从下拉列表中选择预配置的策略。有关更多信息,请参阅Amazon Elasticsearch Service 中的 Identity and Access Management关于 VPC 域的访问策略

    注意

    如果您选择VPC 访问在步骤 18 中,禁止基于 IP 的策略。但您可以使用安全组来控制哪些 IP 地址可以访问该域。有关更多信息,请参阅关于 VPC 域的访问策略

  24. (可选)如果要求对域的所有请求都通过 HTTPS 到达,请选中 Require HTTPS for all traffic to the domain (要求到域的所有流量都使用 HTTPS) 复选框。

  25. (可选)要启用节点到节点加密,请选中 Node-to-node encryption (节点到节点加密) 复选框。有关更多信息,请参阅Amazon Elasticsearch Service 的节点到节点加密

  26. (可选)要启用静态数据加密,请选中 Enable encryption at rest (启用静态数据的加密) 复选框。

    Select(默认值)aws/es让 Amazon ES 代表您创建 KMS 加密钥(或使用它已创建的加密钥)。否则,请从 KMS 主密钥菜单中选择您自己的 KMS 加密密钥。有关更多信息,请参阅Amazon Elasticsearch Service 的静态数据加密数据

  27. 选择 Next

  28. Review (审核) 页面上,查看您的域配置,然后选择 Confirm (确认)

创建亚马逊 ES 域 (Amazon CLI)

除了使用控制台创建 Amazon ES 域之外,您还可以使用Amazon CLI。有关语法,请参 Amazon Elasticsearch ServiceAmazonCLI 命令参考

示例命令

此第一个示例演示了以下 Amazon ES 域配置:

  • 创建名为的 Amazon ES 域我的日志带弹性搜索版本 7.10

  • r6g.large.elasticsearch 实例类型的两个实例填充该域

  • 使用 100GiB 通用型 (SSD) EBS 卷作为每个数据节点的存储

  • 允许匿名访问,但只能从单个 IP 地址访问:192.0.2.0/32

aws es create-elasticsearch-domain --domain-name mylogs --elasticsearch-version 7.10 --elasticsearch-cluster-config InstanceType=r6g.large.elasticsearch,InstanceCount=2 --ebs-options EBSEnabled=true,VolumeType=gp2,VolumeSize=100 --access-policies '{"Version": "2012-10-17", "Statement": [{"Action": "es:*", "Principal":"*","Effect": "Allow", "Condition": {"IpAddress":{"aws:SourceIp":["192.0.2.0/32"]}}}]}'

下一个示例演示了以下 Amazon ES 域配置:

  • 创建名为的 Amazon ES 域我的日志带弹性搜索版本 7.10

  • r6g.large.elasticsearch 实例类型的六个实例填充该域

  • 使用 100GiB 通用型 (SSD) EBS 卷作为每个数据节点的存储

  • 限制单个用户访问该服务,由用户的 Amazon Web Services 账户 ID: 555555555555

  • 跨三个可用区分配实例

aws es create-elasticsearch-domain --domain-name mylogs --elasticsearch-version 7.10 --elasticsearch-cluster-config InstanceType=r6g.large.elasticsearch,InstanceCount=6,ZoneAwarenessEnabled=true,ZoneAwarenessConfig={AvailabilityZoneCount=3} --ebs-options EBSEnabled=true,VolumeType=gp2,VolumeSize=100 --access-policies '{"Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": {"AWS": "arn:aws:iam::555555555555:root" }, "Action":"es:*", "Resource": "arn:aws:es:us-east-1:555555555555:domain/mylogs/*" } ] }'

下一个示例演示了以下 Amazon ES 域配置:

  • 创建名为的 Amazon ES 域我的日志带弹性搜索版本 7.10

  • r6g.xlarge.elasticsearch 实例类型的十个实例填充该域

  • r6g.large.elasticsearch 实例类型的三个实例作为专用主节点填充该域

  • 使用 100GiB 预配置 IOPS EBS 卷作为存储,用每个数据节点 1000 IOPS 的基准性能进行配置

  • 限制对单个用户和单个子资源的访问,_search API

aws es create-elasticsearch-domain --domain-name mylogs --elasticsearch-version 7.10 --elasticsearch-cluster-config InstanceType=r6g.xlarge.elasticsearch,InstanceCount=10,DedicatedMasterEnabled=true,DedicatedMasterType=r6g.large.elasticsearch,DedicatedMasterCount=3 --ebs-options EBSEnabled=true,VolumeType=io1,VolumeSize=100,Iops=1000 --access-policies '{"Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "AWS": "arn:aws:iam::555555555555:root" }, "Action": "es:*", "Resource": "arn:aws:es:us-east-1:555555555555:domain/mylogs/_search" } ] }'
注意

如果您尝试创建 Amazon ES 域并且已存在具有相同名称的域,则 CLI 不会报告错误。相反,它会返回现有域的详细信息。

创建亚马逊 ES 域 (Amazon开发工具包)

这些区域有:Amazon开发工具包(除 Android 和 iOS 软件开发工具包之外)支持在亚马逊 ES 配置 API 参考,包括CreateElasticsearchDomain。有关示例代码,请参阅 使用Amazon与 Amazon Elasticsearch Service 进行交互的开发工具包。有关安装和使用Amazon开发工具包,请参阅Amazon软件开发工具包

配置访问策略

Amazon Elasticsearch Service 提供了多种方式来配置您的 Amazon ES 域访问。有关更多信息,请参阅Amazon Elasticsearch Service 中的 Identity and Access ManagementAmazon Elasticsearch (Amazon Elasticsearch Service) 中的精细访问控制

控制台提供了预配置的访问策略,您可以针对自己域的特定需求自定义这些策略。您也可以从其他 Amazon ES 域导入访问策略。有关这些访问策略如何与 VPC 访问交互的信息,请参阅关于 VPC 域的访问策略

配置访问策略 (控制台)

  1. 转至 https://aws.amazon.com,然后选择 Sign In to the Console (登录控制台)

  2. Analytics 下,选择 Elasticsearch Service

  3. 在导航窗格中的 My domains (我的域) 下,选择要更新的域。

  4. 选择 Actions (操作)Modify access policy (修改访问策略)

  5. 编辑访问策略 JSON,或使用下拉列表选择预配置的选项。

  6. 选择 Submit

高级选项

使用高级选项来配置以下内容:

rest.action.multi.allow_explicit_index

指定是否允许在 HTTP 请求正文中显式引用索引。将此属性设置为 false 可防止用户绕过子资源的访问控制。默认情况下,该值为 true。有关更多信息,请参阅高级选项和 API 注意事项

indices.fielddata.cache.size

指定分配到字段数据的 Java 堆空间的百分比。默认情况下,此设置为 JVM 堆的 20%。

注意

许多客户查询轮换每日索引。建议您使用基准测试indices.fielddata.cache.size配置为 JVM 堆的 40%。对于非常大的索引,您可能需要大型字段数据缓存。

indices.query.bool.max_clause_count

指定 Lucene 布尔查询中允许的子句的最大数量。默认值为 1024。如果查询具有的子句数超过了允许的子句数,则会导致 TooManyClauses 错误。有关更多信息,请参阅 Lucene 文档