语音标记类型 - Amazon Polly
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

语音标记类型

SynthesizeSpeechStartSpeechSynthesisTask 命令使用 SpeechMarkTypes 选项来请求语音标记。您可以指定要从您输入的文本返回的元数据元素。您可以请求最多 4 种类型的元数据,但每个请求必须至少指定一种类型。未根据请求生成音频输出。

Amazon CLI 中的代码示例:

--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly 生成使用以下元素的语音标记:

  • 句子 – 表示输入文本中的句子元素。

  • 单词 – 表示输入文本中的单词元素。

  • 语音视位 – 描述说每个音素时的面部和口腔运动。有关更多信息,请参阅语音视位和 Amazon Polly

  • ssml – 描述 SSML 输入文本中的 <mark> 元素。有关更多信息,请参阅由 SSML 文档生成语音