本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 Hudi CLI
您可以使用 Hudi CLI 来管理 Hudi 数据集,以查看有关提交、文件系统、统计信息等的信息。您还可以使用手动执行压缩、安排压实或取消预定的压缩。CLI有关更多信息,请参阅 Apache Hudi 文档CLI中的通过交互
启动 Hudi CLI 并连接到数据集
-
使用连接到主节点SSH。有关更多信息,请参阅《Amazon EMR 管理指南》SSH中的 “使用连接到主节点”。
-
在命令行中,键入
/usr/lib/hudi/cli/bin/hudi-cli.sh
。命令提示符更改为
hudi->
。 -
键入以下代码以连接到数据集。Replace(替换)
s3://amzn-s3-demo-bucket/myhudidataset
其中包含您要使用的数据集的路径。我们使用的值与前面示例中建立的值相同。connect --path
s3://amzn-s3-demo-bucket/myhudidataset
命令提示符将更改以包括您连接到的数据集,如以下示例所示。
hudi:
myhudidataset
->