步骤 1:创建不需要字词的列表 - Amazon Transcribe
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

步骤 1:创建不需要字词的列表

要创建词汇表筛选条件,您可以创建要从转录结果中筛选的字词的列表,并将其保存在文本文件中。或者,您可以使用 CreateVocabularyFilter 操作并在 Words 参数中输入要作为字符串数组筛选的字词。虽然在 CreateVocabularyFilter 操作中列出不需要的字词更加方便,但如果您使用文本文件,您可以稍后编辑您的字词列表并在另一个词汇表筛选条件中重复使用它。

以下指南适用于词汇表筛选条件:

  • 词汇表筛选条件中的字词不区分大小写。例如,“curse”和“CURSE”被认为是同一个字词。

  • Amazon Transcribe 仅筛选与筛选条件中的字词完全匹配的字词。例如,如果您的筛选条件包含“swear”,则 Amazon Transcribe 筛选“swear”,但不筛选“swears”。 您必须提供要筛选的字词的每个变体。

  • Amazon Transcribe 不会筛选包含在其他字词中的字词。例如,如果词汇表筛选条件包含“marine”,但不包含“submarine”,则“submarine”将出现在您的转录结果中。

要使用控制台创建字词列表,请完成以下步骤。要使用 CreateVocabularyFilter 操作,请参阅步骤 2:创建词汇表筛选条件

创建未筛选字词的列表(控制台)

  1. 在文本编辑器中,创建一个新文件,然后将每个字词放在单独的行中,后跟换行符 (\n),如以下示例所示。

    profanity curse swear ... obscenity
  2. 在本地或 Amazon Simple Storage Service (Amazon S3) 中将列表另存为纯文本文件。

下一步

步骤 2:创建词汇表筛选条件