Amazon Polly 工作原理

Amazon Polly 可以将输入文本转化为逼真的语音。要使用一种 Amazon Polly 语音，请选择语音引擎，调用语音合成方法，提供要合成的文本，然后指定音频输出格式。然后，Amazon Polly 将提供的合成文本合成为高质量语音音频流。

输入文本 — 提供要合成的文本，然后 Amazon Polly 返回音频流。您可以提供纯文本格式或语音合成标记语言（SSML）格式的输入。借助 SSML，您可以控制语音的各个方面，如发音、音量、音高和语速。有关更多信息，请参阅由 SSML 文档生成语音。
可用语音 — Amazon Polly 提供了语言和各种语音的组合，包括双语语音（适用于英语和印地语）。对于大多数语言，您可以从多种男性和女性语音中选择。在启动语音合成任务时，您可以指定语音 ID，然后 Amazon Polly 将使用此语音将文本转换为语音。Amazon Polly 不是翻译服务，即，合成的语音采用文本的语言。数位形式的数字（例如，53 而不是五十三）采用语音的语言而不是文本合成。有关更多信息，请参阅 Amazon Polly 中的语音。
输出格式 — Amazon Polly 可以提供多种格式的合成语音。您可以选择适合您需求的音频格式。例如，您可以请求 MP3 或 Ogg Vorbis 格式的语音以供 Web 和移动应用程序使用。或者，您可以请求 PCM 输出格式以供 Amazon IoT 设备和电话解决方案使用。对于电话应用程序，您可以使用 mu-law 或 a-law 格式。

要在您的浏览器中收听 Amazon Polly 语音示例，请参阅 Amazon Polly 产品概述。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

什么是 Amazon Polly？

优势