Amazon Polly
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

使用 SSML (控制台)

您可以利用 SSML 标签自定义并控制语音的各个方面,例如发音、音量和语速。在 AWS 控制台中,在“文本到语音转换”页面的 SSML 选项卡上输入要转换为音频的 SSML 增强文本。以纯文本形式输入的文本依赖于所选语言和语音的默认设置,而使用 SSML 增强的文本不仅会向 Amazon Polly 告知您所说的内容,还会告知您希望如何说。除了添加的 SSML 标签,Amazon Polly 合成 SSML 增强文本的方式与合成纯文本的方式相同。参阅 练习 2:合成语音 (纯文本输入) 了解更多信息。

在使用 SSML 时,您用 <speak> 标签包含整个文本,以便让 Amazon Polly 知道您正在使用 SSML。例如:

<speak>Hi! My name is Joanna. I will read any text you type here.</speak>

然后,您对 <speak> 标签中的文本使用特定的 SSML 标签来定义所需的文本发音方式。您可以添加停顿、改变讲话的节奏、降低或提高声音的音量或添加许多其他自定义项,使文本的发音适合您。有关可使用的 SSML 标签的完整列表,请参阅 支持的 SSML 标签

在以下示例中,您将使用 SSML 标签告知 Amazon Polly 在朗读一个短段落时将“W3C”替换为“World Wide Web Consortium”。您还可以使用标签引入停顿以及轻读某词。将此练习的结果与 使用控制台应用词典 (合成语音) 进行比较。

有关 SSML 的更多信息以及示例,请参阅 支持的 SSML 标签

由 SSML 增强文本合成语音 (控制台)

  1. 登录 AWS 管理控制台,并通过以下网址打开 Amazon Polly 控制台:https://console.aws.amazon.com/polly/

  2. 请选择 Text-to-Speech (文本到语音转换) 选项卡 (如果未显示)。

  3. 选择 SSML 选项卡。

  4. 在文本框中键入或粘贴以下文本:

    <speak> He was caught up in the game.<break time="1s"/> In the middle of the 10/3/2014 <sub alias="World Wide Web Consortium">W3C</sub> meeting, he shouted, "Score!" quite loudly. When his boss stared at him, he repeated <amazon:effect name="whispered">"Score"</amazon:effect> in a whisper. </speak>

    Amazon Polly 可通过 SSML 标签获知如何处理文本:

    • <break time="1s"/> 告知 Amazon Polly 在最开始的两句话之间停顿 1 秒。

    • <sub alias="World Wide Web Consortium">W3C</sub> 告知 Amazon Polly 将缩写 W3C 替换为 World Wide Web Consortium。

    • <amazon:effect name="whispered">Score</amazon:effect> 告知 Amazon Polly 轻读第二个 "Score"。

      注意

      如果使用 AWS CLI,请将输入文本放在引号中,以便与周围的代码进行区分。Amazon Polly 控制台不会显示您的代码,所以您在使用时不需要将输入文本放在引号中。

  5. 对于 Choose a language and region (选择语言和区域),选择 English US (美国英语),然后选择一个语音。

  6. 要收听语音,请选择 Listen to speech (收听语音)

  7. 要保存语音文件,请选择 Download [format] (下载 [格式])。如果要另存为其他格式,请选择 Change file format (更改文件格式),然后选择您需要的格式。然后选择 Change (更改)Download [format] (下载 [格式])