Amazon Polly
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

语音标记

语音标记 是描述合成语音的元数据,例如,句子或单词在音频流中的起始和结束位置。当您为文本请求语音标记时,Amazon Polly 将返回此元数据,而不是合成语音。通过将语音标记与合成语音音频流配合使用,您可以为您的应用程序提供更强的视觉体验。

例如,通过将元数据与来自文本的音频流组合使用,您就能够将语音与面部动画同步 (嘴唇同步),或者在说出字幕单词时对其进行突出显示。