Amazon Polly 的工作原理 - Amazon Polly
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon Polly 的工作原理

Amazon Polly 将输入文本转换为栩如生的语音。调用语音合成方法之一,提供要合成的文本,选择神经文本到语音转换 (NTTS) 或标准文本到语音转换 (TTS) 语音之一,并指定音频输出格式。然后,Amazon Polly 将提供的合成文本合成为高质量语音音频流。

  • 输入文本— 提供您想要合成的文本,Amazon Polly 将返回音频流。您可以提供纯文本格式或语音合成标记语言 (SSML) 格式的文本。借助 SSML,您可以控制语音的各个方面,如发音、音量、音高和语速。有关更多信息,请参阅由 SSML 文档生成语音

     

  • 可用语音— Amazon Polly 提供了语言和各种语音的组合,包括双语语音(适用于英语和印地语)。对于大多数语言,您可以从多种男性和女性语音中选择。在启动语音合成任务时,您可以指定语音 ID,然后 Amazon Polly 将使用此语音将文本转换为语音。Amazon Polly 不是翻译服务 — 合成的语音采用与文本相同的语言。但是,如果文本的语言与为语音指定的语言不同,则表示为阿拉伯数字的数字(例如,53,而不是五十三)将以语音而非文本的语言合成。有关更多信息,请参阅 。Amazon Polly 中的语音.

     

  • 输出格式— Amazon Polly 可以提供多种格式的合成语音。您可以选择适合您需求的音频格式。例如,您可以请求 MP3 或 Ogg Vorbis 格式的语音,以供 Web 和移动应用程序使用。或者,您可以请求 PCM 输出格式,以供 Amazon IoT 设备和通话解决方案使用。

接下来做什么?

如果您不熟练了解 Amazon Polly,我们建议您阅读以下主题: