本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
语音速度
由于语音之间的自然差异,每个可用的语音将以略微不同的速度朗读文本。例如,对于美国英语语音,在说“Mary had a little lamb”时,Ivy 和 Joanna 的语速比 Matthew 的语速略快一点,比 Joey 的语速快很多。
由于声音之间的差异很大,而且这种差异的程度可能取决于所说的文字,因此 Amazon Polly 语音没有标准速度(每分钟字数)。但是,您可以使用以下方法查看您的声音需要多长时间才能说出所选文本 SpeechMarks。有关将 Amazon Polly 配合使用的更多信息,请参阅使用语音标记
看看朗读一段文本大概需要多长时间
打开 Amazon CLI。
运行以下代码(根据需要填充)
aws polly synthesize-speech \ --language-code
optional language code if needed
--output-format json \ --voice-id[name of desired voice]
\ --text '[desired text]
' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt打开 LengthOfText .txt
如果文字是 “玛丽有一只小羔羊”,那么Amazon Polly 返回的最后几行将是:
{"time":882,"type":"viseme","value":"t"}
{"time":964,"type":"viseme","value":"a"}
{"time":1082,"type":"viseme","value":"p"}
最后一个 viseme(本质上是“lamb”的最后几个字母的读音)在语音开始后 1082 毫秒开始。虽然这不是音频的准确长度,但很接近,可用作比较语音的基础。
更改您的语音速度
对于某些应用程序,您可能会发现,您更希望放慢或加快您喜欢的语音。如果语音速度令人担忧,Amazon Polly 可以使用 SSML 标签对其进行修改。
例如:
您的组织正在创建一个为移民受众朗读书籍的应用程序。这些受众会说英语,但其流利程度有限。在这种情况下,您可以考虑放慢语音速度,以便在应用程序进行朗读时为您的受众提供多一点的理解时间。
Amazon Polly 使用 SSML <prosody>标签帮助您降低语速,如下所示:
<speak> In some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>
or
<speak> In some cases, it might help your audience to <prosody rate="slow">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>
在 Amazon Polly 上使用 SSML 时,有两种速度可供选择:
预设速度:
x-slow
、slow
、medium
、fast
和x-fast
。在这些情况下,每个选项的速度都是近似的,具体取决于您的首选语音。medium
选项是正常的语音速度。语音速度的 n%:可使用介于 20% 和 200% 之间的任何语音速度的百分比。在这些情况下,您可以选择自己所需的速度。但是,语音的实际速度是近似值,具体取决于您选择的语音。100% 被视为语音的正常速度。
由于每个选项的速度都是近似值,并且取决于所选语音,因此,我们建议您以各种速度测试所选语音,以查看完全符合您需求的内容。
有关使用 prosody
标签以获得最佳效果的更多信息,请参阅 控制音量、语速和音高