语音标记 - Amazon Polly
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

语音标记

语音标记 是描述合成语音的元数据,例如,句子或单词在音频流中的起始和结束位置。当您为文本请求语音标记时,Amazon Polly 将返回此元数据,而不是合成语音。通过将语音标记与合成语音音频流配合使用,您可以为您的应用程序提供更强的视觉体验。

例如,通过将元数据与来自文本的音频流组合使用,您就能够将语音与面部动画同步(嘴唇同步),或者在说出字幕单词时对其进行突出显示。

使用神经或标准文本到语音转换格式时可以使用语音标记。