Amazon Transcribe的工作原理 - Amazon Transcribe
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon Transcribe的工作原理

Amazon Transcribe 可分析包含语音的音频文件,然后使用先进的机器学习技术将语音数据转录为文本。使用转录的方式与使用文本文档的方式相同。

为了转录音频文件,Amazon Transcribe 使用三个操作:

  • StartTranscriptionJob – 启动批处理作业以将音频文件中的语音转录为文本。

  • ListTranscriptionJobs – 返回已启动的转录任务的列表。您可以指定希望操作返回的任务状态。例如,您可以获得所有待处理任务的列表,或已完成任务的列表。

  • GetTranscriptionJob – 返回转录任务的结果。响应中包含的链接指向一个包含结果的 JSON 文件。

为了将流音频转录为文本,Amazon Transcribe 提供了一个操作:

  • StartStreamTranscription – 启动双向 HTTP/2 流,其中音频将流式传输到 Amazon Transcribe 并且转录结果将流式传输到您的应用程序。

您也可以开始 WebSocket 协议流发送音频 Amazon Transcribe. 有关更多信息,请参阅将 Amazon Transcribe 流式处理与 WebSockets 结合使用

您可以使用 Amazon Transcribe 创建和管理解决方案的自定义词汇表。自定义词汇表向 Amazon Transcribe 提供了有关如何处理音频剪辑中的语音的更多信息。

您可以转录以下任一语言的语音:

  • 海湾阿拉伯语 (ar-AE)

  • 现代标准阿拉伯语 (ar-SA)

  • 中国大陆普通话 (zh-CN)

  • 荷兰语 (nl-NL)

  • 澳大利亚英语 (en-AU)

  • 英国英语 (en-GB)

  • 印度英语 (en-IN)

  • 爱尔兰英语 (en-IE)

  • 苏格兰英语 (en-AB)

  • 美国英语 (en-US)

  • 威尔士英语 (en-WL)

  • 法语 (fr-FR)

  • 加拿大法语 (fr-CA)

  • 波斯语 (fa-IR)

  • 德语 (de-DE)

  • 瑞士德语 (de-CH)

  • 希伯来语 (he-IL)

  • 印度印地语 (hi-IN)

  • 印度尼西亚语 (id-ID)

  • 意大利语 (it-IT)

  • 日语 (ja-JP)

  • 韩语 (ko-KR)

  • 马来语 (ms-MY)

  • 葡萄牙语 (pt-PT)

  • 巴西葡萄牙语 (pt-BR)

  • 俄语 (ru-RU)

  • 西班牙语 (es-ES)

  • 美国西班牙语 (es-US)

  • 泰米尔语 (ta-IN)

  • 泰卢固语 (te-IN)

  • 土耳其语 (tr-TR)

您可以用下列语言进行流式转录:

  • 澳大利亚英语 (en-AU)

  • 英国英语 (en-GB)

  • 美国英语 (en-US)

  • 法语 (fr-FR)

  • 加拿大法语 (fr-CA)

  • 美国西班牙语 (es-US)

Amazon Transcribe 有能力转录非母语人士带有口音的讲话。例如,通过 Amazon Transcribe,您可以转录带有德语 (de-DE) 口音的美国英语 (en-US) 音频。