语音速度 - Amazon Polly
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

语音速度

由于语音之间的自然差异,每个可用的语音将以略微不同的速度朗读文本。例如,对于美国英语语音,在说“Mary had a little lamb”时,Ivy 和 Joanna 的语速比 Matthew 的语速略快一点,比 Joey 的语速快很多。

由于声音之间的差异很大,而且这种差异的程度可能取决于所说的文字,因此 Amazon Polly 语音没有标准速度(每分钟字数)。但是,您可以使用以下方法查看您的声音需要多长时间才能说出所选文本 SpeechMarks。有关将 Amazon Polly 配合使用的更多信息,请参阅使用语音标记

看看朗读一段文本大概需要多长时间
  1. 打开 Amazon CLI。

  2. 运行以下代码(根据需要填充)

    aws polly synthesize-speech \ --language-code optional language code if needed --output-format json \ --voice-id [name of desired voice] \ --text '[desired text]' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt
  3. 打开 LengthOfText .txt

如果文字是 “玛丽有一只小羔羊”,那么Amazon Polly 返回的最后几行将是:

{"time":882,"type":"viseme","value":"t"} {"time":964,"type":"viseme","value":"a"} {"time":1082,"type":"viseme","value":"p"}

最后一个 viseme(本质上是“lamb”的最后几个字母的读音)在语音开始后 1082 毫秒开始。虽然这不是音频的准确长度,但很接近,可用作比较语音的基础。

更改您的语音速度

对于某些应用程序,您可能会发现,您更希望放慢或加快您喜欢的语音。如果语音速度令人担忧,Amazon Polly 可以使用 SSML 标签对其进行修改。

例如:

您的组织正在创建一个为移民受众朗读书籍的应用程序。这些受众会说英语,但其流利程度有限。在这种情况下,您可以考虑放慢语音速度,以便在应用程序进行朗读时为您的受众提供多一点的理解时间。

Amazon Polly 使用 SSML <prosody>标签帮助您降低语速,如下所示:

<speak> In some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

or

<speak> In some cases, it might help your audience to <prosody rate="slow">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

在 Amazon Polly 上使用 SSML 时,有两种速度可供选择:

  • 预设速度:x-slowslowmediumfastx-fast。在这些情况下,每个选项的速度都是近似的,具体取决于您的首选语音。medium 选项是正常的语音速度。

  • 语音速度的 n%:可使用介于 20% 和 200% 之间的任何语音速度的百分比。在这些情况下,您可以选择自己所需的速度。但是,语音的实际速度是近似值,具体取决于您选择的语音。100% 被视为语音的正常速度。

由于每个选项的速度都是近似值,并且取决于所选语音,因此,我们建议您以各种速度测试所选语音,以查看完全符合您需求的内容。

有关使用 prosody 标签以获得最佳效果的更多信息,请参阅 控制音量、语速和音高