语音输入 - Amazon Transcribe
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

语音输入

要转录音频文件,您可以使用转录作业。您将文件作为对象存储在 Amazon S3 存储桶中。输入文件必须为:

  • 在FLAC、MP3、MP4、Ogg、 WebM、AMR或WAV文件格式

  • 长度少于4小时或少于2GB的音频数据

注意

对于AMR, Amazon Transcribe 支持自适应多速率宽带(AMR-WB)和自适应多速率窄频(AMR-NB)编解码器。

对于Ogg和 WebM 文件格式, Amazon Transcribe 支持Opus编解码器。

指定输入文件的语言和格式。

要获得最佳效果:

  • 使用无损格式,例如 FLAC 或以 PCM 16 位编码的 WAV。

  • 对电话音频使用 8000 Hz 的采样率。