Amazon Polly
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

创建长音频文件

要为大段文本创建 TTS 文件,请使用 Amazon Polly 的异步合成功能。这需要使用三个 SpeechSynthesisTask API:

  • StartSpeechSynthesisTask:启动新合成任务。

  • GetSpeechSynthesisTask:返回有关以前提交的合成任务的详细信息。

  • ListSpeechSynthesisTasks:列出所有已提交的合成任务。

SynthesizeSpeech 操作以近乎实时的方式生成音频,大多数情况下延迟较短。为此,此操作只能合成 3000 个字符。

Amazon Polly 的异步合成功能通过更改文档的合成和返回方式克服了处理较大文本文档的挑战。当通过使用 StartSpeechSynthesisTask 提交输入文本来发出合成请求时,Amazon Polly 会将请求排队,然后在系统资源可用时立即在后台异步处理这些请求。之后,Amazon Polly 将生成的语音或语音标记流直接上传到(必需的)Amazon Simple Storage Service (Amazon S3) 存储桶,并通过(可选的)SNS 主题通知您已完成文件的可用性。

通过这种方式,除近乎实时的处理之外的所有其他功能都可用于长度长达 100000 个计费字符(或总计 200000 个字符)的文本。

要使用此方法合成文档,您必须具有音频文件可保存到其中的可写 Amazon S3 存储桶。您可以通过提供可选的 SNS 主题标识符在合成音频准备就绪时收到通知。当合成任务完成后,Amazon Polly 将在该主题上发布消息。在合成任务未成功的情况下,此消息可能还包含有用的错误信息。为此,请确保创建合成任务的用户也可以发布到 SNS 主题。有关如何创建和订阅 SNS 主题的更多信息,请参阅 Amazon SNS 文档

加密

您可以加密形式将输出文件存储在 S3 存储桶中(如果需要)。为此,请启用 Amazon S3 存储桶加密,它使用可用的最强数据块密码之一(256 位高级加密标准 (AES-256))。