Amazon Polly
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

语音标记类型

SynthesizeSpeechStartSpeechSynthesisTask 命令使用 SpeechMarkTypes 选项来请求语音标记。您可以指定要从您输入的文本返回的元数据元素。您可以请求最多 4 种类型的元数据,但每个请求必须至少指定一种类型。未根据请求生成音频输出。

在 AWS CLI 中,例如:

--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly 生成使用以下元素的语音标记:

  • sentence – 表示输入文本中的语句元素。

  • word – 表示输入文本中的单词元素。

  • viseme – 描述说每个音素时的面部和口腔运动。有关更多信息,请参阅语音视位和 Amazon Polly

  • ssml – 描述 SSML 输入文本中的 <mark> 元素。有关更多信息,请参阅由 SSML 文档生成语音