使用词汇表筛选来筛选不需要的字词 - Amazon Transcribe
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

使用词汇表筛选来筛选不需要的字词

您可以通过词汇表筛选 屏蔽或删除不希望出现在转录结果中的字词。例如,您可以使用词汇表筛选来防止显示攻击性或亵渎性词语。这使您可以生成适合家庭观看的电视节目字幕或适合受众的会议转录内容。对您认为亵渎、淫秽、令人反感或其他不适合转录内容的读者的字词使用词汇表筛选。

词汇表筛选同时适用于实时流和批处理。对于这两种转录处理方法,您可以屏蔽不需要的字词(在转录中用三个星号 (***) 替换它们)或完全删除它们。 对于实时流,您可以使用标签来标记在转录结果的词汇表筛选条件中列出的字词。然后,您可以手动删除某些转录中的字词,并将其留在其他转录中,以便从单个流为多个受众生成转录。

要筛选不需要的字词,请执行以下操作:

  1. 创建不需要的字词列表。

  2. 创建词汇表筛选条件。

  3. 启动您的实时流或转录作业,并指定您的词汇表筛选条件和方法。方法(屏蔽、删除或标记)指示您希望如何从转录中筛选字词。

您可以使用 Amazon Transcribe 控制台或 API 筛选不需要的字词。