Amazon Transcribe
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

Amazon Transcribe 如何工作

Amazon Transcribe 可分析包含语音的音频文件,然后使用先进的机器学习技术将语音数据转录为文本。使用转录的方式与使用文本文档的方式相同。

为了转录音频文件,Amazon Transcribe 使用三个操作:

  • StartTranscriptionJob – 启动异步任务,将音频文件中的语音转录为文本。

  • ListTranscriptionJobs – 返回已启动的转录任务的列表。您可以指定希望操作返回的任务状态。例如,您可以获得所有待处理任务的列表,或已完成任务的列表。

  • GetTranscriptionJob – 返回转录任务的结果。响应中包含的链接指向一个包含结果的 JSON 文件。

为了将流音频转录为文本,Amazon Transcribe 提供了一个操作:

  • StartStreamTranscription – 启动双向 HTTP/2 流,其中音频将流式传输到 Amazon Transcribe 并且转录结果将流式传输到您的应用程序。

您也可以使用 Amazon Transcribe 创建和管理解决方案的自定义词汇表。自定义词汇表向 Amazon Transcribe 提供了有关如何处理音频剪辑中的语音的更多信息。

您可以转录以下任一语言的语音:

  • 现代标准阿拉伯语 (ar-SA)

  • 澳大利亚英语 (en-AU)

  • 英国英语 (en-GB)

  • 印度英语 (en-IN)

  • 美国英语 (en-US)

  • 法语 (fr-FR)

  • 加拿大法语 (fr-CA)

  • 德语 (de-DE)

  • 印度印地语 (hi-IN)

  • 意大利语 (it-IT)

  • 韩语 (ko-KR)

  • 巴西葡萄牙语 (pt-BR)

  • 西班牙语 (es-ES)

  • 美国西班牙语 (es-US)

您可以用下列语言进行流式转录:

  • 英国英语 (en-GB)

  • 美国英语 (en-US)

  • 法语 (fr-FR)

  • 加拿大法语 (fr-CA)

  • 美国西班牙语 (es-US)