

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 语音视位和 Amazon Polly
<a name="viseme"></a>

*语音视位*代表说一个词时的面部和口腔位置。它是一个音素的视觉等价物，是形成单词的基本声学单元。语音视位是语音的基本可视构建基块。

每种语言都有一组对应于其特定音素的语音视位。在语言中，每个音素都有相应的代表口腔发音时的形状的语音视位。然而，并非所有语音视位都能映射到特定的音素，因为许多音素虽然听上去不一样，但发音时的形状相同。例如，在英语中，单词“pet”（宠物）和“bet”（打赌）声音上是不同的。但是，在目视观察中（无声音），它们看起来完全相同。

下图列出了美国英语语音的部分国际音标 (IPA) 音素和拓展音标字母评估法 (X-SAMPA) 符号，及其对应的语音视位。

如需获得完整列表和所有可用语音的表格，请参阅 [Amazon Polly 中的语言](supported-languages.md)。


<table>
<thead>
  <tr><th>IPA</th><th>X-SAMPA</th><th>说明</th><th>示例</th><th>语音视位</th></tr>
</thead>
<tbody>
  <tr><td colspan="5">**辅音**</td></tr>
  <tr><td>b</td><td>b</td><td>浊双唇塞音</td><td>**b**ed</td><td>p</td></tr>
  <tr><td>d</td><td>d</td><td>浊齿龈塞音</td><td>**d**ig</td><td>t</td></tr>
  <tr><td>d͡ʒ</td><td>dZ</td><td>浊龈后塞擦音</td><td>**j**ump</td><td>S</td></tr>
  <tr><td>ð</td><td>D</td><td>浊齿擦音</td><td>**th**en</td><td>T</td></tr>
  <tr><td>f</td><td>f</td><td>清唇齿擦音</td><td>**f**ive</td><td>f</td></tr>
  <tr><td>g</td><td>g</td><td>浊软颚塞音</td><td>**g**ame</td><td>k</td></tr>
  <tr><td>h</td><td>h</td><td>清喉擦音</td><td>**h**ouse</td><td>k</td></tr>
  <tr><td>...</td><td>...</td><td>...</td><td>...</td><td>...</td></tr>
</tbody>
</table>
