本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 Hudi CLI
您可以使用 Hudi CLI 管理 Hudi 数据集,以查看有关提交、文件系统、统计信息等的信息。还可以使用 CLI 手动执行压缩、计划压缩或取消计划的压缩。有关更多信息,请参阅 Apache Hudi 文档中的 CLI 互动
启动 Hudi CLI 并连接到数据集
-
使用 SSH 连接主节点。有关更多信息,请参阅《Amazon EMR 管理指南》中的使用 SSH 连接到主节点。
-
在命令行中,键入
/usr/lib/hudi/cli/bin/hudi-cli.sh
。命令提示符更改为
hudi->
。 -
键入以下代码以连接到数据集。将
s3://DOC-EXAMPLE-BUCKET/myhudidataset
替换为您想要使用的数据集的路径。我们使用的值与前面示例中建立的值相同。connect --path
s3://DOC-EXAMPLE-BUCKET/myhudidataset
命令提示符将更改以包括您连接到的数据集,如以下示例所示。
hudi:
myhudidataset
->