Step 2: Creating a Vocabulary Filter - Amazon Transcribe
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

如果我们为英文版本指南提供翻译,那么如果存在任何冲突,将以英文版本指南为准。在提供翻译时使用机器翻译。

Step 2: Creating a Vocabulary Filter

您可以使用 CreateVocabularyFilter 操作或 Amazon Transcribe 控制台创建词汇表筛选条件。

如果您使用 CreateVocabularyFilter 操作,您可以在词汇表筛选条件中将字词作为字符串数组输入到 Words 参数中。虽然此方法更方便,但如果您创建一个文本文件,您可以稍后编辑您的字词列表并在另一个词汇表筛选条件中重复使用它。

创建词汇筛选条件(控制台)

要使用控制台创建词汇表筛选条件,您必须具有包含要筛选的字词的纯文本文件,格式如Step 1: Creating a List of Unwanted Words 中所述。您的文件可以保存到本地或 Amazon Simple Storage Service (Amazon S3) 中。

To create a vocabulary filter (console)

  1. 登录 AWS 管理控制台并通过 Amazon Transcribe 控制台打开 Amazon Transcribe 控制台。

  2. 在导航窗格中,选择 Vocabulary filtering (词汇筛选)

  3. 选择 Create vocabulary filter (创建词汇筛选条件)

  4. 对于 名称,输入 您的AWS帐户内唯一的词汇筛选器名称。

  5. 对于语言,选择词汇表筛选条件的语言的语言代码。

  6. 对于词汇表输入源,请选择以下选项之一:

    • 如果您保存了包含要在本地筛选的字词的文件,请选择文件上传,然后选择选择文件并选择该文件。

    • 如果您保存文件 Amazon S3,对于 S3位置,输入文本文件的URI或选择 浏览S3 并浏览至文件并选择。

  7. 选择 Create vocabulary filter (创建词汇筛选条件)

创建词汇筛选条件 (API)

  • CreateVocabularyFilter 操作中,指定以下内容:

    1. 词汇筛选条件的名称,此名称在 AWS 账户中对 VocabularyFilterName 参数是唯一的

    2. LanguageCode 参数中源音频语言的语言代码

    3. 使用以下选项之一的词汇表筛选条件的字词:

      • 指定 Amazon Simple Storage Service (Amazon S3)位置 文本文件的 VocabularyFilterFileUri 使用此格式的参数: s3:///vocabulary-filter-example.txt.

      • Words 参数中输入字词作为字符串的数组,例如 ["word", "banana", "potato", "chair"]

要查看您创建的所有词汇表筛选条件,请使用 ListVocabularyFilters 操作。然后,您可以使用 GetVocabularyFilter 要检索的操作 您的词汇筛选器下载URI 并详细了解该过滤器。

以下是一个示例 AWS Command Line Interface (AWS CLI) 请求,旨在使用存储在 Amazon S3 存储桶中的文本文件创建词汇筛选条件。这些命令后跟 JSON 格式的响应元素。

aws transcribe create-vocabulary-filter \ --vocabulary-filter-name your-filter-name \ --language-code en-US \ --vocabulary-filter-file-uri s3:///vocabulary-filter-example.txt { "VocabularyFilterName": "your-filter-name", "LanguageCode": "en-US" }

下一步

Step 3: Filtering Transcriptions