什么是 Amazon Polly? - Amazon Polly
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

什么是 Amazon Polly?

Amazon Polly 云服务可以将文本转化为逼真的语音。可以使用 Amazon Polly 开发能提高参与度和可用性的应用程序。Amazon Polly 支持多种语言并且包含各种逼真的声音,因此,您可以构建支持语音并能用于各种位置的应用程序,并使用适合客户的声音。使用 Amazon Polly,您只需为合成的文本付费。您也可以免费缓存和重放 Amazon Polly 生成的语音。

Amazon Polly 提供了许多语音选项,包括:长篇语音(可发出类似人类、极富表现力且情感丰富的语音),以及神经文本转语音 (NTTS) 声音。这些语音采用新的机器学习技术,在语音质量方面实现了突破性改进,并提供了极其自然、类似人类的文本转语音声音。神经 TTS 技术还支持播音员风格,专为新闻播报使用案例量身定制。

Amazon Polly 的常用案例包括但不限于移动应用程序(如新闻阅读器、游戏、电子学习平台)、视障人士辅助功能应用程序以及快速增长的物联网 (IoT) 细分市场。

Amazon Polly 经认证可用于 1996 年《健康保险可携性与责任法 (HIPAA)》和支付卡行业数据安全标准 (PCI DSS) 的受监管工作负载。

使用 Amazon Polly 的一些好处包括:

  • 高质量 — Amazon Polly 提供新的神经 TTS 和一流的标准 TTS 技术,以合成发音精度极高的超自然语音(包括缩写、首字母缩略词扩展、日期/时间解释和同义词消歧)。

  • 低延迟 — Amazon Polly 确保快速响应,这使其能适用于低延迟使用案例(如对话系统)。

  • 支持多种语言和语音 — Amazon Polly 支持数十种语音语言,并为大多数语言提供男性和女性语音选项。随着我们推出的神经语音越来越多,这个数字将继续增加。美国英语语音 Matthew 和 Joanna 也可以使用神经播音员风格,与专业新闻主播的发音十分相似。

  • 经济实惠 — Amazon Polly 的按需付费模式意味着没有设置成本。您可以从小规模开始,然后视应用程序的发展情况进行扩展。

  • 基于云的解决方案 — 设备上的 TTS 解决方案需要大量的计算资源,特别是 CPU 功率、RAM 和磁盘空间。这些可能增加平板电脑、智能手机等设备的开发成本和功耗。相比之下,在 Amazon Web Services 云 中完成 TTS 转换大大降低了对本地资源的需求。这样就能够以尽可能高的质量支持所有可用的语言和语音。此外,还可以立即向所有最终用户提供语音改进,并且不需要进行额外的设备更新。

您是否是首次接触 Amazon Polly 的用户?

如果您是首次接触 Amazon Polly 服务的用户,我们建议您按列出的顺序阅读以下各节:

  1. Amazon Polly 工作原理 — 本节介绍了各种您可以使用的 Amazon Polly 输入和选项,以创造端到端体验。

  2. Amazon Polly 入门 — 在本部分中,您将设置账户并测试 Amazon Polly 语音合成。

  3. 示例应用程序 — 本节提供了可供您探索 Amazon Polly 的更多示例。