

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 长篇语音
<a name="long-form-voices"></a>

Amazon Polly 有一个**长篇引擎**，可发出类似人类、极富表现力且情感丰富的语音。长篇语音旨在吸引听众关注较长内容，例如新闻文章、培训材料或营销视频。

Amazon Polly 长篇语音是使用前沿深度学习 TTS 技术开发而成。该模型学习复制人类语言的音素、韵律、语调以及其他语音和声学方面，从而产生高度自然的语音输出。

长篇引擎使用文本嵌入来解释文本的含义。长篇引擎使用文本嵌入后，可以产生自然语音的正确重点、停顿和语气。最后得到的语音能够结合人类交流中存在的各种情感元素。这包括模仿惊讶的对话或者将对话与叙事区分开来。这些结合在一起，便打造出听起来像真人一样的优质语音产品。

**注意**  
这些声音背后的 state-of-the-art技术属于用于语言和语音建模的生成式人工智能的范式。这项技术的一个副作用是，对训练数据和模型的任何更新都可能会导致语音听起来略有不同，即使随着模型的更新，语音的整体质量有所提高，也是如此。这可能会影响由长期合成的不同内容部分组成的应用场景，例如一个季度的播客。

## 可用的长篇语音
<a name="long-form-voicelist"></a>

Amazon Polly 目前提供四种 en-US 和两种 es-ES 长篇语音。这两种语言都有女声和男声可供选择。英语长篇语音 Daniel、Gregory 和 Ruth 还有对话式 NTTS 变体。


|  | 语言 | 语言代码 | 名称/ID | 性别 | 
| --- | --- | --- | --- | --- | 
| 1 |  **英语（美国）**  | en-US |  Danielle Gregory Ruth Patrick  |  女 男 女 男  | 
| 2 |  **西班牙语（西班牙）**  | es-ES |  Alba Raúl  |  女 男  | 

## 特征和区域兼容性
<a name="long-form-regions"></a>

Amazon Polly 长篇语音在以下区域可用：
+ 美国东部（弗吉尼亚北部）：us-east-1
+ 其他区域不可用

**Amazon Polly 长篇引擎支持以下特征：**
+ 实时和异步语音合成操作。
+ 所有[语音标记](https://docs.amazonaws.cn/polly/latest/dg/speechmarks.html)。
+ Amazon Polly 支持许多（但不是所有）SSML 标签。有关 NTTS 支持的 SSML 标签的更多信息，请参阅[支持的 SSML 标签](https://docs.amazonaws.cn/polly/latest/dg/supportedtags.html)。
+ 与标准语音一样，您可以从各种采样率中进行选择，以优化应用程序的带宽和音频质量。标准、长篇和神经语音的有效采样率为 8 kHz、16 kHz、22 kHz 或 24 kHz。标准语音的默认值为 22 kHz。长篇和神经语音的默认值为 24 kHz。Amazon Polly 支持 MP3 OGG (Vorbis) 和原始 PCM 音频流格式。

**注意**  
长篇语音费用在 [Amazon Polly 定价信息页面](https://www.amazonaws.cn/polly/pricing/)上列示。