StartSpeechSynthesisTask - Amazon Polly
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

StartSpeechSynthesisTask

允许通过启动新任务来创建异步合成任务SpeechSynthesisTask。此操作需要语音合成所需的所有标准信息,以及用于存储合成任务输出的 Amazon S3 存储桶的名称和两个可选参数(OutputS3KeyPrefixSnsTopicArn)。合成任务创建后,此操作将返回一个SpeechSynthesisTask对象,该对象将包括该任务的标识符以及当前状态。启动异步合成任务后,该SpeechSynthesisTask对象在 72 小时内可用。

请求语法

POST /v1/synthesisTasks HTTP/1.1 Content-type: application/json { "Engine": "string", "LanguageCode": "string", "LexiconNames": [ "string" ], "OutputFormat": "string", "OutputS3BucketName": "string", "OutputS3KeyPrefix": "string", "SampleRate": "string", "SnsTopicArn": "string", "SpeechMarkTypes": [ "string" ], "Text": "string", "TextType": "string", "VoiceId": "string" }

URI 请求参数

该请求不使用任何 URI 参数。

请求正文

请求接受采用 JSON 格式的以下数据。

Engine

指定 Amazon Polly 在处理用于语音合成的输入文本时使用的引擎(standardneural)。使用所选引擎不支持的语音将导致错误。

类型:字符串

有效值: standard | neural

必需:否

LanguageCode

语音合成请求的可选语言代码。只有在使用双语语音(例如 Aditi)时,才需要这样做,后者可以用于印度英语(en-in)或印地语(Hi-in)。

如果使用双语语音但未指定语言代码,Amazon Polly 将使用双语语音的默认语言。任何声音的默认语言都是LanguageCode参数DescribeVoices操作返回的语言。例如,如果未指定语言代码,Aditi 将使用印度英语而不是印地语。

类型:字符串

有效值: arb | cmn-CN | cy-GB | da-DK | de-DE | en-AU | en-GB | en-GB-WLS | en-IN | en-US | es-ES | es-MX | es-US | fr-CA | fr-FR | is-IS | it-IT | ja-JP | hi-IN | ko-KR | nb-NO | nl-NL | pl-PL | pt-BR | pt-PT | ro-RO | ru-RU | sv-SE | tr-TR | en-NZ | en-ZA

必需:否

LexiconNames

你希望该服务在合成过程中应用的一个或多个发音词典名称的列表。只有当词典的语言与语音的语言相同时,词典才会适用。

类型:字符串数组

数组成员:最多 5 项。

模式:[0-9A-Za-z]{1,20}

必需:否

OutputFormat

对返回的输出进行编码的格式。对于音频直播,这将是 mp3、ogg_vorbis 或 pcm。对于语音标记,这将是 json。

类型:字符串

有效值: json | mp3 | ogg_vorbis | pcm

必需:是

OutputS3BucketName

将输出文件保存到的 Amazon S3 存储桶名称。

类型:字符串

模式:^[a-z0-9][\.\-a-z0-9]{1,61}[a-z0-9]$

必需:是

OutputS3KeyPrefix

输出语音文件的 Amazon S3 ervice Service Service

类型:字符串

模式:^[0-9a-zA-Z\/\!\-_\.\*\'\(\):;\$@=+\,\?&]{0,800}$

必需:否

SampleRate

以 Hz 为单位指定的音频频率。

mp3 和 ogg_vorbis 的有效值为 “80000”、“16000”、“22050” 和 “240000”。标准语音的默认值为 “22050”。神经语音的默认值为 “24000”。

pcm 的有效值为 “8000” 和 “16000” 默认值为 “160000”。

类型:字符串

必需:否

SnsTopicArn

SNS 主题的 ARN 可选择用于为语音合成任务提供状态通知。

类型:字符串

模式:^arn:aws(-(cn|iso(-b)?|us-gov))?:sns:[a-z0-9_-]{1,50}:\d{12}:[a-zA-Z0-9_-]{1,256}$

必需:否

SpeechMarkTypes

为输入文本返回的语音标记类型。

类型:字符串数组

数组成员:最多 4 项。

有效值: sentence | ssml | viseme | word

必需:否

Text

要合成的输入文本。如果您将 ssml 指定为 TextType,请按照 SSML 格式输入文本。

类型:字符串

必需:是

TextType

指定输入文本是纯文本还是 SSML。默认值为纯文本。

类型:字符串

有效值: ssml | text

必需:否

VoiceId

要用于合成的语音 ID。

类型:字符串

有效值: Aditi | Amy | Astrid | Bianca | Brian | Camila | Carla | Carmen | Celine | Chantal | Conchita | Cristiano | Dora | Emma | Enrique | Ewa | Filiz | Gabrielle | Geraint | Giorgio | Gwyneth | Hans | Ines | Ivy | Jacek | Jan | Joanna | Joey | Justin | Karl | Kendra | Kevin | Kimberly | Lea | Liv | Lotte | Lucia | Lupe | Mads | Maja | Marlene | Mathieu | Matthew | Maxim | Mia | Miguel | Mizuki | Naja | Nicole | Olivia | Penelope | Raveena | Ricardo | Ruben | Russell | Salli | Seoyeon | Takumi | Tatyana | Vicki | Vitoria | Zeina | Zhiyu | Aria | Ayanda

必需:是

响应语法

HTTP/1.1 200 Content-type: application/json { "SynthesisTask": { "CreationTime": number, "Engine": "string", "LanguageCode": "string", "LexiconNames": [ "string" ], "OutputFormat": "string", "OutputUri": "string", "RequestCharacters": number, "SampleRate": "string", "SnsTopicArn": "string", "SpeechMarkTypes": [ "string" ], "TaskId": "string", "TaskStatus": "string", "TaskStatusReason": "string", "TextType": "string", "VoiceId": "string" } }

响应元素

如果此操作成功,则该服务将会发送回 HTTP 200 响应。

服务以 JSON 格式返回的以下数据。

SynthesisTask

SynthesisTask 提供有关新提交的语音合成任务的信息和属性的对象。

类型:SynthesisTask 对象

错误

EngineNotSupportedException

此引擎与您指定的语音不兼容。选择与引擎兼容的新声音,或者更换引擎并重新启动操作。

HTTP 状态代码:400

InvalidS3BucketException

提供的Amazon S3 Storage Service 请按照 S3 存储桶命名要求检查您的输入,然后重试。

HTTP 状态代码:400

InvalidS3KeyException

提供的Amazon S3 key prefix e Service 请提供有效的 S3 对象密钥名称。

HTTP 状态代码:400

InvalidSampleRateException

指定的采样率无效。

HTTP 状态代码:400

InvalidSnsTopicArnException

提供的 SNS 主题 ARN 无效。请提供有效的 SNS 主题 ARN,然后重试。

HTTP 状态代码:400

InvalidSsmlException

您提供的 SSML 无效。验证 SService Service Service Service。

HTTP 状态代码:400

LanguageNotSupportedException

Amazon Polly 目前不以这种身份支持指定的语言。

HTTP 状态代码:400

LexiconNotFoundException

Amazon Polly ice Pervice Service Service S 这可能是由于词典缺失、名称拼写错误或指定了位于不同区域的词典所致。

验证词典是否存在、位于该区域(参见ListLexicons)以及您拼写的词典名称拼写是否正确。然后重试。

HTTP 状态代码:404

MarksNotSupportedForFormatException

OutputFormat所选内容不支持语音标记。语音标记仅适用于json格式化内容。

HTTP 状态代码:400

ServiceFailureException

未知情况导致服务故障。

HTTP 状态代码:500

SsmlMarksNotSupportedForTextTypeException

纯文本类型输入不支持 SSML 语音标记。

HTTP 状态代码:400

TextLengthExceededException

“文本” 参数的值长于可接受的限制。对于SynthesizeSpeech API,输入文本的总限制最多为 6000 个字符,其中最多可以计费 3000 个字符。对于StartSpeechSynthesisTask API,最大值为 200,000 个字符,其中不能超过 100,000 个字符作为计费字符。SSML 标签不会算作计费字符。

HTTP 状态代码:400

另请参阅

有关在特定语言的 Amazon 软件开发工具包中使用此 API 的更多信息,请参阅以下内容: