Amazon Polly
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

Amazon Polly 中的限制

以下是使用 Amazon Polly 时应注意的限制。

支持的区域

有关可使用 Amazon Polly 的 AWS 区域的列表,请参阅 Amazon Web Services 一般参考 中的 AWS 区域和终端节点

目前,以下区域支持神经语音:

  • 美国东部(弗吉尼亚北部):us-east-1

  • 美国西部(俄勒冈):us-west-2

  • 欧洲(爱尔兰):eu-west-1

这些区域的终端节点和协议与标准语音所用的相同。

限制

  • 每个账户的限制速率:每秒 100 个事务(请求或操作)(tps),突增限制为 120 tps。

    每个账户的并发连接数:90

  • 每个操作的限制率:

    操作

    限制

    词典

    DeleteLexicon

    PutLexicon

    GetLexicon

    ListLexicons

    这些操作组合起来为每秒任意 2 个事务 (tps)。

    允许的最大突增为 4 tps。

    语音

    DescribeVoices

    80 tps,突增限制为 100 tps

    SynthesizeSpeech

    标准语音:80 tps,突增限制为 100 tps

    神经语音:8 tps,突增限制为 10 tps

    StartSpeechSynthesisTask

    标准语音:10 tps,突增限制为 12 tps

    神经语音:1 tps

    GetSynthesizeSpeechTaskListSynthesizeSpeechTask

    总共最多允许 10 tps

发音词典

  • 您可以在每个账户中存储最多 100 个词典。

  • 词典名称可以是不超过 20 个字符的字母数字字符串。

  • 每个词典的大小最多为 4,000 个字符。(请注意,词典的大小会影响 SynthesizeSpeech 操作的延迟。)

  • 您可以在词典中为每个 <phoneme> 或 <alias> 替换指定最多 100 个字符。

有关使用词典的信息,请参阅 管理词典

SynthesizeSpeech API 操作

请注意以下与使用 SynthesizeSpeech API 操作相关的限制:

  • 输入文本最大为 3000 个计费字符 (总计 6000 个字符)。SSML 标签不会算作计费字符。

  • 您可以指定最多 5 个要应用于输入文本的词典。

  • 输出音频流(合成)限制为 10 分钟。达到此限制之后,将截断任何剩余语音。

有关更多信息,请参阅 SynthesizeSpeech

注意

使用 SynthesizeSpeech API 操作可绕过 StartSythensizeSpeechTask API 操作的一些限制。有关更多信息,请参阅 创建长音频文件

SpeechSynthesisTask API 操作

请注意以下与使用 StartSpeechSynthesisTaskGetSpeechSynthesisTaskListSpeechSynthesisTasks API 操作相关的限制:

  • 输入文本最大为 100,000 个计费字符 (总计 200,000 个字符)。SSML 标签不会算作计费字符。

  • 您可以指定最多 5 个要应用于输入文本的词典。

语音合成标记语言 (SSML)

请注意以下与使用 SSML 有关的限制:

  • <audio><lexicon><lookup><voice> 标签不受支持。

  • <break> 元素可以指定的最大持续时间为 10 秒。

  • <prosody> 标签不支持低于 -80% 的费率属性值。

有关更多信息,请参阅 由 SSML 文档生成语音