Amazon Transcribe
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

什么是 Amazon Transcribe?

Amazon Transcribe 使用先进的机器学习技术来识别音频文件中的语音,并将其转录为文本。您可以使用 Amazon Transcribe 将音频转换为文本并创建融合音频文件内容的应用程序。例如,您可以转录视频录制中的音轨来为视频创建隐藏字幕。

您可以使用 Amazon Transcribe 将以下语言转录为文本:

  • 现代标准阿拉伯语 (ar-SA)

  • 澳大利亚英语 (en-AU)

  • 英国英语 (en-GB)

  • 印度英语 (en-IN)

  • 美国英语 (en-US)

  • 法语 (fr-FR)

  • 加拿大法语 (fr-CA)

  • 德语 (de-DE)

  • 印度印地语 (hi-IN)

  • 意大利语 (it-IT)

  • 韩语 (ko-KR)

  • 巴西葡萄牙语 (pt-BR)

  • 西班牙语 (es-ES)

  • 美国西班牙语 (es-US)

您可以用下列语言来转录流音频:

  • 英国英语 (en-GB)

  • 美国英语 (en-US)

  • 法语 (fr-FR)

  • 加拿大法语 (fr-CA)

  • 美国西班牙语 (es-US)

您可以将 Amazon Transcribe 与其他 AWS 服务结合使用来创建应用程序。例如,您可以:

  • 使用 Amazon Transcribe 将语音转为文本,将文本发送到 Amazon Translate 以翻译为其他语言,然后将翻译后的文本发送到 Amazon Polly 以便朗读出来。

  • 使用 Amazon Transcribe 转录客户服务通话录音以进行分析。在转录录音后,将转录内容发送到 Amazon Comprehend 以标识关键字、主题或情绪。

  • 使用 Amazon Transcribe 可以转录直接广播(例如电视)以提供实时字幕。

使用 Amazon Transcribe,您可以将音频文件存储在 Amazon S3 存储桶中。转录任务中的输出也将存储在 S3 存储桶中。传输到 Amazon S3 存储桶的内容可能包含客户内容。有关删除敏感数据的更多信息,请参阅如何清空 S3 存储桶?如何删除 S3 存储桶?

识别语音

Amazon Transcribe 可识别音频剪辑中的各个发言者,这种技术称作分类发言者识别。在激活发言者识别技术时,Amazon Transcribe 会包含一个可标识音频剪辑中的每个发言者的属性。您可以使用发言者识别技术来:

  • 识别录制的客户支持通话中的客户和支持代表

  • 识别隐藏字幕的字符

  • 识别录制的新闻发布会或讲座中的发言者和提问者

您可以指定希望 Amazon Transcribe 在音频剪辑中识别的语音数量。

转录单独的音频通道

要在音频文件中为每个通道创建脚本或创建录制的声音的单个流,请使用通道识别。利用通道识别功能,Amazon Transcribe 可返回两个或多个转录:所有音频通道的组合转录和每个音频通道的转录。

在您的音频位于多个通道上时使用通道识别。例如,在以下情况下使用通道识别:

  • 当您的记录在一个通道上具有客户服务代表且在另一个通道上具有客户时

  • 当您转录播客时,其中在一个通道上记录主机,在另一个通道上记录来宾

有关通道识别的更多信息,请参阅通道识别

转录流音频

您可以使用 Amazon Transcribe 来实时转录流音频。您向 Amazon Transcribe 发送音频流,Amazon Transcribe 将返回包含音频转录的 JSON 对象流。

有关处理音频流的更多信息,请参阅流式转录

自定义词汇表

创建自定义词汇表可帮助 Amazon Transcribe 识别特定于您的使用案例的词,并提高其在语音到文本转换过程中的准确性。例如,您可以创建自定义词汇表,其中包括行业特定的词和短语。

使用自定义词汇表可帮助 Amazon Transcribe 识别:

  • 未识别的词

  • 特定于您的领域的不熟悉的词

有关创建自定义词汇表的更多信息,请参阅自定义词汇表

您是 Amazon Transcribe 的新用户吗?

如果您是新用户,建议您按顺序阅读以下部分:

  1. Amazon Transcribe 如何工作—Amazon Transcribe 简介。

  2. Amazon Transcribe 入门—介绍如何设置您的 AWS 账户和使用 Amazon Transcribe。

  3. API 参考—包含 Amazon Transcribe 操作的参考文档。