Amazon Polly
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

Amazon Polly 中的语音

Amazon Polly 以多种语言提供各种不同的声音,以便在从文本合成语音时使用。

可用语音

语言

女性姓名/ID

男性姓名/ID

阿拉伯语 (arb)

Zeina

中文普通话 (cmn-CN)

知语

丹麦语 (da-DK)

Naja

Mads

荷兰语 (nl-NL)

Lotte

Ruben

英语(澳大利亚)(en-AU)

Nicole

Russell

英语(英国)(en-GB)

Amy

Emma

Brian

英语(印度)(en-IN)

Aditi(与印地语是双语)

Raveena

英语(美国)(en-US)

Ivy

Joanna

Kendra

Kimberly

Salli

Joey

Justin

Matthew

英语(威尔士)(en-GB-WLS)

Geraint

法语 (fr-FR)

Céline/Celine

Mathieu

法语(加拿大)(fr-CA)

Chantal

德语 (de-DE)

Marlene

Vicki

Hans

印地语 (hi-IN)

Aditi(与印度英语是双语)

冰岛语 (is-IS)

Dóra/Dora

Karl

意大利语 (it-IT)

Carla

Bianca

Giorgio

日语 (ja-JP)

Mizuki

Takumi

韩语 (ko-KR)

Seoyeon

挪威语 (nb-NO)

Liv

波兰语 (pl-PL)

Ewa

Maja

Jacek

Jan

葡萄牙语(巴西)(pt-BR)

Vitória/Vitoria

Ricardo

葡萄牙语(欧洲)(pt-PT)

Inês/Ines

Cristiano

罗马尼亚语 (ro-RO)

Carmen

俄语 (ru-RU)

Tatyana

Maxim

西班牙语(欧洲)(es-ES)

Conchita

Lucia

Enrique

西班牙语(墨西哥)(es-MX)

Mia

西班牙语(美国)(es-US)

Penélope/Penelope

Miguel

瑞典语 (sv-SE)

Astrid

土耳其语 (tr-TR)

Filiz

威尔士语 (cy-GB)

Gwyneth

为了确保为客户提供持续支持,我们不打算停用任何语音。这适用于当前可用及未来的语音。

收听语音

您可以使用 Amazon Polly 控制台收听来自 Amazon Polly 中提供的任何语音的示例

收听 Amazon Polly 中的语音

  1. 登录到 AWS 管理控制台,然后打开 Amazon Polly 控制台

  2. 选择 Text-to-Speech 选项卡。

  3. 选择语言和区域,然后选择语音

  4. 为要说出的语音输入文本或使用默认短语,然后选择收听语音

您可以选择 Amazon Polly 提供的任何语言,控制台将显示该语言的可用语音。在大多数情况下,至少有一个男性语音和一个女性语音,通常每个语音都不止一个。有一种语音是双语(印地语和印度英语),一些语言只有一种语音。

注意

语音目录和包含的语言的数量正在不断更新以包括更多选择。要建议一种新的语言或语音,请在此页上提供反馈。遗憾的是,我们无法在发布特定的新语言计划时进行评论。

每个语音都是用母语人士创造的,因此,语音与语音之间存在变化,甚至在同一种语言中也是如此。在为您的项目选择语音时,您应使用一段文本来测试每一个可能的语音,以了解哪个语音最能满足您的需求。

语音速度

由于语音之间的自然差异,每个可用的语音将以略微不同的速度朗读文本。例如,对于美国英语语音,在说“Mary had a little lamb”时,Ivy 和 Joanna 的语速比 Matthew 的语速略快一点,比 Joey 的语速快很多。

由于语音之间有很大的差异,而且这种差异的程度取决于所朗读的文本,因此,任何标准语速(每分钟单词数)均不适用于 Amazon Polly 语音。不过,您可以使用 SpeechMarks 来查明用您的语音朗读选定文本需要多长时间。有关在 Amazon Polly 中使用 SpeechMarks 的更多信息,请参阅使用语音标记

看看朗读一段文本大概需要多长时间

  1. 打开 AWS CLI。

  2. 运行以下代码(根据需要填充)

    aws polly synthesize-speech \ --language-code optional language code if needed --output-format json \ --voice-id [name of desired voice] \ --text '[desired text]' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt
  3. 打开 LengthOfText.txt

如果文本为“Mary had a little lamb”,则 Amazon Polly 返回的最后几行将为:

{"time":882,"type":"viseme","value":"t"} {"time":964,"type":"viseme","value":"a"} {"time":1082,"type":"viseme","value":"p"}

最后一个 viseme(本质上是“lamb”的最后几个字母的读音)在语音开始后 1082 毫秒开始。虽然这不是音频的准确长度,但很接近,可用作比较语音的基础。

对于某些应用程序,您可能会发现,您更希望放慢或加快您喜欢的语音。如果需要考虑语音速度,Amazon Polly 会提供使用 SSML 标签进行修改的能力。

例如,如果您的目标受众会说英语,但不流畅,您可能会考虑放慢语音速度,以便为他们多提供一点时间进行理解。

Amazon Polly 可使用 SSML <prosody> 标签来帮助您放慢语音速度,与以下情况下类似:

<prosody rate="slow">Mary had a little lamb.</prosody>

为您提供了五个不同的速度选项:x-slowslowmediumfastx-fast。每个选项的速度都是近似值,具体取决于您的首选语音,因此我们建议测试所选语音以查看它是否满足您的需求。medium 选项是正常的语音速度。