NTTS 说话风格 - Amazon Polly
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

如果我们为英文版本指南提供翻译,那么如果存在任何冲突,将以英文版本指南为准。在提供翻译时使用机器翻译。

NTTS 说话风格

人们会根据上下文使用不同的讲话风格。例如,非正式对话听起来与电视或电台新闻广播有很大不同。当 Amazon Polly 使用标准语音合成语音时,会使用拼接方法。拼接方法将存储在音频数据库中的短语音片段串接在一起,生成尽可能最佳、发音最自然的语音。但是,由于制作这些声音的方式,这些声音不能产生不同的说话风格。

除了标准的连接合成外,Amazon Polly 还可以使用神经技术来生成语音。Amazon Polly 使用序列到序列模型生成神经语音。在该模型生成的结果中,使用音频数据输入制作语音,同时考虑数据在输出序列中的位置。然后,该语音可以用作一个非常自然的声音,或者可以针对特定的说话风格进行训练,体现这种风格固有的某些部分语音的语调变化和重音。

Amazon Polly 提供了两种说话风格,可以使用:播音员和对话式。

播音员风格使用神经系统来生成电视或电台播音员风格的语音。播音员风格适用于 Matthew 和 Joanna 语音,这些语音提供美国英语 (en-US) 版;还适用于 Lupe 语音,该语音提供美国西班牙语 (es-US) 版。

对话式风格使用神经系统,以更加友好和富有表现力的对话式风格制作语音,这种风格可以在许多使用案例中使用。对话式风格仅适用于 Matthew 和 Joanna 语音,这些语音仅提供美国英语 (en-US) 版。