CreateVocabularyFilter - Amazon Transcribe
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

CreateVocabularyFilter

创建一个新的词汇筛选条件,可使用它从转录输出中筛选单词。例如,您可以使用此操作从成绩单中删除亵渎。

请求语法

{ "LanguageCode": "string", "Tags": [ { "Key": "string", "Value": "string" } ], "VocabularyFilterFileUri": "string", "VocabularyFilterName": "string", "Words": [ "string" ] }

请求参数

有关所有操作通用的参数的信息,请参阅常见参数.

请求接受采用 JSON 格式的以下数据。

LanguageCode

词汇过滤器中单词的语言代码。过滤器中的所有单词必须使用相同的语言。词汇过滤器只能与指定语言的转录作业一起使用。

类型: 字符串

有效值: af-ZA | ar-AE | ar-SA | cy-GB | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | ga-IE | gd-GB | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ

必填项:是

Tags

在创建此新词汇过滤器时,将一个或多个标签(每个标签以 key: value 对的形式)添加到新的词汇过滤器中。

类型: 数组Tag对象

数组成员:最少 1 项。最多 200 项。

必填项:否

VocabularyFilterFileUri

用作创建词汇过滤器的输入的文本文件的 Amazon S3 位置。仅使用为自定义词汇表定义的字符集中的字符。有关字符集的列表,请参阅自定义词汇表的字符集.

您的词汇筛选器文件的大小必须小于 50KB。

请注意,如果你包括VocabularyFilterFileUri在您的请求中,您无法使用Words;必须从中选择一项。

类型: 字符串

长度约束:最小长度为 1。长度上限为 2000。

模式:(s3://|http(s*)://).+

必填项:否

VocabularyFilterName

您的新词汇表筛选条件的名称。

此名称区分大小写,不能包含空格,且必须在Amazon Web Services 账户. 如果你尝试创建一个与之前的词汇过滤器同名的词汇过滤器,你会得到ConflictException错误消息。

类型: 字符串

长度约束:最小长度为 1。最大长度为 200。

模式:^[0-9a-zA-Z._-]+

必填项:是

Words

词汇过滤器中想要的单词。仅使用中指定的字符字符集对于你正在转录的语言。

请注意,如果你包括Words在您的请求中,您无法使用VocabularyFilterFileUri;必须从中选择一项。

类型: 字符串数组

数组成员:最少 1 项。

长度约束:最小长度为 1。长度上限为 256。

必填项:否

响应语法

{ "LanguageCode": "string", "LastModifiedTime": number, "VocabularyFilterName": "string" }

响应元素

如果此操作成功,则该服务将会发送回 HTTP 200 响应。

服务以 JSON 格式返回的以下数据。

LanguageCode

与词汇过滤器关联的语言代码。

类型: 字符串

有效值: af-ZA | ar-AE | ar-SA | cy-GB | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | ga-IE | gd-GB | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ

LastModifiedTime

修改词汇表筛选条件的日期和时间。

类型: 时间戳

VocabularyFilterName

词汇表筛选器的名称。

类型: 字符串

长度约束:最小长度为 1。最大长度为 200。

模式:^[0-9a-zA-Z._-]+

错误

有关所有操作常见错误的信息,请参阅常见错误.

BadRequestException

您的请求没有通过一个或多个验证测试。例如,如果您尝试删除的实体不存在,或者它处于非终端状态(例如,它 “正在进行中”)。请参阅例外Message字段以获取更多信息。

HTTP 状态代码:400

ConflictException

已经有一个具有该名称的资源。

HTTP 状态代码:400

InternalFailureException

发生内部服务器错误。检查错误消息并再次尝试请求。

HTTP 状态代码:500

LimitExceededException

您已经发送过多的请求或您的输入文件中包含太长。等待,然后再重新发送您的请求,或使用较小的文件,然后重新发送请求。

HTTP 状态代码:400

另请参阅

有关在特定语言的Amazon软件开发工具包中使用此 API 的更多信息,请参阅以下内容: