Amazon Polly
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

常见问题

本主题提供了有关 Amazon Polly 的常见问题的解答。

一般性问题

问:我的文本使用了几种不同的编码标准。我可以对 Amazon Polly 使用哪种标准?

目前,Amazon Polly 仅支持 UTF-8 编码标准。

问:我是否可以保存合成的语音?

当您使用 SynthesizeSpeech 操作时,可以保存合成的输出以便在您自己的系统上使用。也可以调用 Amazon Polly,然后使用任何加密密钥加密该文件并将其存储在 Amazon Simple Storage Service (Amazon S3) 或任何其他安全存储中。Amazon Polly SynthesizeSpeech 调用是无状态的,并且与客户身份无关。您之后无法从 Amazon Polly 中检索它。

当您使用 StartSpeechSynthesisTask 操作(异步合成)时,合成的输出会自动存储在 Amazon S3 存储桶中。然后,您可以在需要时检索它。有关此选项的更多信息,请参阅 创建长音频文件

内容呈现

问:我希望在两种不同的语言中使用相同的语音。是否有双语语音?

目前,只有一种语音是双语:Aditi(印地语和印度英语)。通过使用双语语音,您可以合成本身包含任一语言或在单一文本中包含两种语言的语音。利用 Aditi,当 Amazon Polly 同时包含 Devangari(印地语脚本)和 Romanagari(拉丁语脚本)时,它还可以合成语音。

我们正在不断努力改进 Amazon Polly 的语言选项,包括增加双语语音的数量。有关更多信息,请参阅双语语音

问:当选择 pcm 作为输出格式时,使用了哪些 pcm 详细信息?

当使用 pcm 时,返回的内容为有符号 16 位、1 个通道(单声道)、little-endian 格式的 audio/pcm

问:通过 Amazon Polly 说出时,我的一些文本在错误音节上出现了重音。我甚至尝试使用重音符 (U+0301) 来标记重音,但它仍位于错误的音节上。如何修复此问题?

Amazon Polly 目前无法识别用于指示一个单词中的音节重音的重音符 (U+0301)。但是,您可以通过两种方式更改一个单词中的重音。您可以使用 IPA 语音和 ssml 标签来更改该单词的发音。有关更多信息,请参阅 Amazon Polly 支持的 SSML 标签。在某些语言中,您还可以在音节后面紧接使用撇号以指示重音的更改。例如,在俄语中,单词 страны́ 和 стра́ны 具有不同的重音 (此处使用重音符进行标记)。但是,由于拼写相同,Amazon Polly 将根据标准语言使用规范将这两个单词发音为在最后一个音节上重读。您可以使用撇号来标记可选择的重读音节(如在 стран'ы 中),Amazon Polly 将重读正确的音节。

问:当我在文本中使用项目符号时,Amazon Polly 无法正确呈现它们。每次遇到一个时它都会显示“减号”。我应该怎么办?

在某些语言中,如果您使用“-”(连字符)来替换项目符号,Amazon Polly 会将其呈现为一个减号。如果您要使用连字符来替换项目符号,可以使用词典条目执行此操作。有关更多信息,请参阅 管理词典

问:我在文本中经常使用“/”(斜杠) 符号,特别是在说“和/或”和“是/否”时。 Amazon Polly 将如何呈现这一内容?

在英语中,Amazon Polly 用语音将“和/或”呈现为“和 或”。 目前,此规则不适用于其他语言。在非英语语言中,Amazon Polly 会将“是/否”呈现为“是 斜杠 否”。 如果您想要更改此行为,则可以使用词典条目。有关更多信息,请参阅管理词典

问:当我使用现有源中的文本以便在 Linux 计算机上使用 AWS CLI 合成语音时,一些 UTF-8 字符似乎不适用于 Amazon Polly,即使在使用控制台时相同的字符似乎正常工作。发生了什么情况?

这是基于 Unix Shell 处理 Unicode 的方式,并不是特定于 Amazon Polly 的问题。提供两种选项:您可以找到问题字符并使用输入文本替换它们,也可以利用不会遇到此问题的访问 Amazon Polly 的替代方式,如 PHP 接口。这是我们正在努力解决的已知问题,而且只有一些不常见的 unicode 字符具有此问题。

问:当我尝试合成包含国际音标 (IPA) 符号的源中的文本时,Amazon Polly 无法识别它们,即使尝试对其中一些符号发音。如果修复此问题?

Amazon Polly 无法识别 IPA 符号,除非使用 SSML(语音合成标记语言)描述它。但是,由于小部分 IPA 符号通常表示读者的发音指南,因此在许多情况下,可通过简单的删除操作从输入文本中安全地删除此部分内容。您也可以使用词典来更改 Amazon Polly 呈现此内容的方式。有关更多信息,请参阅 由 SSML 文档生成语音管理词典

数据安全性与保密性

问:我是否可以选择不记录请求日志及请求 API?

是,您可以通过联系 AWS Support 来请求该操作。

问:我是否可以选择遮蔽特定数据字段以便它们不被存储?(例如,如果我使用敏感数据转换文本,但不我希望它存储在 AWS 系统上,我是否可以遮蔽它?

否。Amazon Polly 目前不支持此功能。

问:我要用于 Amazon Polly 的文本是保密的。如何保护我的数据?

传输过程中,所有文本提交都受安全套接字层 (SSL) 保护,并且使用 RSA 加密进行存储。我们将分开保存服务日志和文本,因此内容无法与客户 ID 关联。因此,Amazon Polly 不会将文本提交与客户身份关联。

问:数据将保留多长时间?

Amazon Polly 将保留数据 14 天。之后,数据将从我们的系统中自动删除。

问:我是否可以请求提前擦除数据?

是,您可以通过联系 AWS Support 来请求该操作。