使用 Hudi CLI - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Hudi CLI

您可以使用 Hudi CLI 来管理 Hudi 数据集,以查看有关提交、文件系统、统计信息等的信息。您还可以使用手动执行压缩、安排压实或取消预定的压缩。CLI有关更多信息,请参阅 Apache Hudi 文档CLI中的通过交互

启动 Hudi CLI 并连接到数据集
  1. 使用连接到主节点SSH。有关更多信息,请参阅Amazon EMR 管理指南》SSH中的 “使用连接到主节点”。

  2. 在命令行中,键入 /usr/lib/hudi/cli/bin/hudi-cli.sh

    命令提示符更改为 hudi->

  3. 键入以下代码以连接到数据集。Replace(替换) s3://DOC-EXAMPLE-BUCKET/myhudidataset 其中包含您要使用的数据集的路径。我们使用的值与前面示例中建立的值相同。

    connect --path s3://DOC-EXAMPLE-BUCKET/myhudidataset

    命令提示符将更改以包括您连接到的数据集,如以下示例所示。

    hudi:myhudidataset->