创建长音频文件 - Amazon Polly
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建长音频文件

要为大量文本创建 TTS 文件,请使用 Amazon Polly 的异步合成功能。这需要使用三个 SpeechSynthesisTask API:

  • StartSpeechSynthesisTask:启动新合成任务。

  • GetSpeechSynthesisTask:返回有关以前提交的合成任务的详细信息。

  • ListSpeechSynthesisTasks:列出所有已提交的合成任务。

SynthesizeSpeech 操作以近乎实时的方式生成音频,大多数情况下延迟较短。为此,此操作只能合成 3000 个字符。

Amazon Polly 的异步合成功能通过改变文档的合成和返回方式,克服了处理更大文本文档的挑战。当通过使用提交输入文本来提出综合请求时,Amazon Polly 会将请求排入队列,然后在系统资源可用时立即在后台异步处理这些请求。StartSpeechSynthesisTask然后,Amazon Polly 将生成的语音或语音标记流直接上传到您的(必需的)Amazon Simple Storage Service (Amazon S3) 存储桶,并通过您的(可选)SNS 主题通知您已完成文件的可用性。

通过这种方式,除近乎实时的处理之外的所有其他功能都可用于长度长达 100000 个计费字符(或总计 200000 个字符)的文本。

要使用此方法合成文档,您必须有一个可写的 Amazon S3 存储桶,音频文件可以保存到该存储桶。您可以通过提供可选的 SNS 主题标识符在合成音频准备就绪时收到通知。合成任务完成后,Amazon Polly 将发布有关该主题的消息。在合成任务未成功的情况下,此消息可能还包含有用的错误信息。为此,请确保创建合成任务的用户也可以发布到 SNS 主题。有关如何创建和订阅 SNS 主题的更多信息,请参阅 Amazon SNS 文档

加密

您可以加密形式将输出文件存储在 S3 存储桶中(如果需要)。为此,请启用 Amazon S3 存储桶加密,它使用可用的最强数据块密码之一(256 位高级加密标准 (AES-256))。