语音标记类型 - Amazon Polly
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

语音标记类型

您可以使用语音标记语音标记类型选项SynthesizeSpeech或者StartSpeechSynthesisTask命令。您可以指定要从您输入的文本返回的元数据元素。您可以请求最多 4 种类型的元数据,但每个请求必须至少指定一种类型。未根据请求生成音频输出。

在Amazon CLI,例如:

--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly 生成使用以下元素的语音标记:

  • 句子 – 表示输入文本中的句子元素。

  • 单词 – 表示输入文本中的单词元素。

  • 语音视位— 描述说每个音素时的面部和口腔运动。有关更多信息,请参阅语音视位和 Amazon Polly

  • SSML— 描述 <mark> SSML 输入文本中的元素。有关更多信息,请参阅由 SSML 文档生成语音