Amazon Polly
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

NTTS 播音员风格

人们会根据上下文使用不同的讲话风格。例如,非正式对话听起来与电视或电台新闻广播有很大不同。当 Amazon Polly 使用标准语音合成语音时,会使用拼接方法。拼接方法将存储在音频数据库中的短语音片段串接在一起,生成尽可能最佳、发音最自然的语音。但是,这些语音录制不区分风格。

Amazon Polly 使用序列到序列模型生成神经语音,生成的结果不仅使用音频数据输入来形成语音,还会考虑数据在输出序列中的位置。然后,它会针对特定的讲话风格进行训练,体现这种风格固有的某些部分语音的语调变化和重音。

播音员风格使用神经系统来生成电视或电台播音员风格的语音。播音员风格仅适用于 Matthew 和 Joanna 语音,这些语音仅提供美国英语 (en-US) 版。

下表提供了使用标准和神经引擎以及播音员风格的 Matthew 和 Joanna 语音发声方式的示例。

使用播音员风格

播音员风格仅适用于使用神经引擎的美国英语 (en-US) 语音 Matthew 或 Joanna 语音。要使用播音员风格,必须首先选择神经引擎,然后在输入文本中使用以下语法。

要应用播音员风格(控制台)

  1. 访问 https://console.amazonaws.cn/polly/,打开 Amazon Polly 控制台。

  2. 在文本到语音转换页面上,对于 Engine (引擎),选择 Neural (神经)

  3. 使用下面的播音员风格 SSML 语法将输入文本添加到文本到语音转换请求中。

要应用播音员风格 (CLI)

  1. 在您的 API 请求中,包含具有 neural 值的引擎参数:

    --engine neural
  2. 使用下面的播音员风格 SSML 语法将输入文本添加到 API 请求中。

在输入文件中使用以下语法。

<amazon:domain name="news">text</amazon:domain>

例如,您可以将播音员标签用于 Matthew 或 Joanna 语音,如下所示:

<speak> <amazon:domain name="news"> From the Tuesday, April 16th, 1912 edition of The Guardian newspaper: The maiden voyage of the White Star liner Titanic, the largest ship ever launched, has ended in disaster. The Titanic started her trip from Southampton for New York on Wednesday. Late on Sunday night she struck an iceberg off the Grand Banks of Newfoundland. By wireless telegraphy she sent out signals of distress, and several liners were near enough to catch and respond to the call. </amazon:domain> </speak>

有关 SSML 的更多信息,请参阅支持的 SSML 标签

本页内容: