

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 语音视位和 Amazon Polly
<a name="viseme"></a>

*语音视位*代表说一个词时的面部和口腔位置。它是一个音素的视觉等价物，是形成单词的基本声学单元。语音视位是语音的基本可视构建基块。

每种语言都有一组对应于其特定音素的语音视位。在语言中，每个音素都有相应的代表口腔发音时的形状的语音视位。然而，并非所有语音视位都能映射到特定的音素，因为许多音素虽然听上去不一样，但发音时的形状相同。例如，在英语中，单词“pet”（宠物）和“bet”（打赌）声音上是不同的。但是，在目视观察中（无声音），它们看起来完全相同。

下图列出了美国英语语音的部分国际音标 (IPA) 音素和拓展音标字母评估法 (X-SAMPA) 符号，及其对应的语音视位。

如需获得完整列表和所有可用语音的表格，请参阅 [Amazon Polly 中的语言](supported-languages.md)。

[See the AWS documentation website for more details](http://docs.amazonaws.cn/polly/latest/dg/viseme.html)