本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
长篇语音
Amazon Polly 有一个长格式引擎,可以产生类似人类、极具表现力和情感熟练的声音。长篇语音旨在吸引听众关注较长内容,例如新闻文章、培训材料或营销视频。
Amazon Polly 长篇语音是使用尖端的深度学习技术开发的。TTS该模型学习复制人类语言的音素、韵律、语调以及其他语音和声学方面,从而产生高度自然的语音输出。
长格式引擎使用文本嵌入来解释文本的含义。使用文本嵌入,长格式引擎可以生成自然语音的正确重点、停顿和语气。结果是一种结合了人类沟通中存在的全部情感元素的声音。这包括模仿令人惊讶的对话或将对话与叙事区分开来。这些结合在一起,便打造出听起来像真人一样的优质语音产品。
注意
这些声音背后的 state-of-the-art 技术属于用于语言和语音建模的生成式人工智能的范式。该技术的一个副作用是,对训练数据和模型的任何更新都可能导致声音的声音略有不同,即使随着模型的更新,声音的整体质量也会有所提高。这可能会对在很长一段时间内合成不同内容部分的用例产生影响,例如一季的播客。
可用的长篇声音
Amazon Polly 目前提供两种女性和一种男性 en-US 长声音。这些长篇声音也有对话NTTS变体。
Language | 语言代码 | 名称/ID | 性别 | |
---|---|---|---|---|
1 |
英语(美国) |
en-US |
Danielle Gregory Ruth |
女 男 女 |
特征和区域兼容性
Amazon Polly 长篇语音可在以下地区使用:
-
美国东部(弗吉尼亚北部):us-east-1
-
其他区域不可用
Amazon Polly 长格式引擎支持以下功能:
注意
长篇语音费用在 Amazon Polly 定价
在主机上使用长格式引擎
你可以通过亚马逊 Polly 主机访问 Amazon Polly 长篇语音或 Amazon CLI.
在主机上使用长格式引擎
-
打开 Amazon Polly 主机,网址为。https://console.aws.amazon.com/polly/
-
从 Amazon Polly 控制台中,选择长格式引擎。
-
从语音下拉菜单中选择所需的声音。
-
使用您选择的文本生成TTS音频。
注意
长篇声音也可以与SynthesizeSpeech
和StartSpeechSynthesisTask
API操作一起使用。对于API操作,客户可以在API请求中指定引擎和语音名称。可以在此处找到更多快速入门代码示例。