什么是 Amazon Transcribe? - Amazon Transcribe
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

什么是 Amazon Transcribe?

Amazon Transcribe 是一项自动语音识别服务,它使用机器学习模型将音频转换为文本。

Amazon Transcribe 的功能允许您提取音频输入、制作易于阅读的成绩单、通过语言自定义提高准确性以及过滤内容以确保客户隐私。Amazon Transcribe 的实际使用案例包括转录和分析客户代理电话以及为视频创建隐藏式字幕。

借助 Amazon Transcribe,您可以向任何应用程序添加语音转文本功能。

Amazon Transcribe 功能

以下列表重点介绍了可用的 Amazon Transcribe 功能所有支持的语言. 有几个功能仅受特定语言支持;请参阅支持的语言和特定于语言的功能了解更多信息。

  • 通道识别:为音频文件中的每个音频通道或创建录制的声音的单个流创建脚本。例如,两个人之间的电话对话由两个独立的音频频道组成。利用通道识别功能,Amazon Transcribe 可返回两个或多个转录:所有音频通道的组合转录和每个音频通道的转录。

  • 自定义词汇表:使用您希望 Amazon Transcribe 在您的音频输入中识别的特殊字词列表。自定义词汇表通常用于 Amazon Transcribe 在转录输出中正确呈现的特定于域的术语或适当的名词。

    使用自定义词汇表可以:

    • 识别行业特定术语

    • 正确显示缩略词

    • 提高转录输出的准确性

    另请参阅:自定义语言模型

  • 语言识别:Amazon Transcribe 可以自动识别媒体中的主要语言。您还可以选择在请求中提供语言建议,以帮助 Amazon Transcribe 缩小语言的可能性,从而提高转录准确性。您可以选择的语言数量在批处理转录和流式转录之间有所不同。有关更多信息,请参阅通过批处理转录作业确定语言使用直播转录进行语言识别.

  • 扬声器拨号:识别音频剪辑中的各个发言者,这种技术称作发言者分类。在激活发言者分类化功能时,Amazon Transcribe 会包含一个可识别音频剪辑中的每个发言者的属性。

    使用扬声器拨号化功能可以:

    • 识别录制的客户支持通话中的客户和支持代表

    • 识别隐藏字幕的字符

    • 识别录制的新闻发布会或讲座中的发言者和提问者

  • 字幕:为视频文件创建字幕。生成字幕时,您可以使用内容密文(仅限美国英语)和词汇过滤器。

    使用字幕来:

    • 为视频文件创建隐藏式字幕

    • 从你的字幕中过滤掉不适当的内容,例如亵渎内容(请注意,过滤或编辑的内容显示为空白空格)***,或者[PII]在你的成绩单和字幕文件中,但音频组件未被更改)

  • 词汇表筛选:屏蔽、删除或标记不希望出现在转录中的字词。词汇表筛选可帮助您筛选任何您认为亵渎、淫秽、令人反感或其他不适合在转录中显示的字词。

    使用词汇过滤功能可以:

    • 为电视节目生成适合家庭的字幕

    • 从会议记录的记录中删除专有条款

重要

并非所有 Amazon Transcribe 功能都可用所有语言;请查看支持的语言和特定于语言的功能开始使用前先表。

Pricing

Amazon Transcribe 是一项即用即付服务;定价基于转录音频的秒数,按月计费。有关成本的更多信息,包括各个地区的成本细分示例,请参阅Amazon Transcribe Streaming.