识别媒体文件中的主导语言 - Amazon Transcribe
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

识别媒体文件中的主导语言

Amazon Transcribe 能够自动识别媒体文件中使用的语言,而无需指定语言代码。语言识别适用于所有人支持的语言; 请注意,批处理作业和流转录支持的语言有所不同。

Batch 作业只能用一种语言进行转录,而流媒体转录每个频道可以有一种语言(最多支持两个频道)。

为了提高语言识别准确性,您可以提供您认为可能存在的语言列表。从此列表中,Amazon Transcribe 选择最接近的匹配语言来转录音频。提供语言代码对于批处理作业是可选的,并且是流式传输转录所需 如果您提供的语言代码都没有与媒体中使用的语言匹配,那么您的转录准确性就会降低。

注意

如果您选择的语言代码都没有与媒体中使用的任何语言匹配,则 Amazon Transcribe 会在所选语言代码子集中选择最接近的选项,并根据该语言生成成绩单。例如,如果你的媒体是美国英语(en-US) 并且您向 Amazon Transcribe 提供了语言代码zh-CNfr-FR, 和de-DE,Amazon Transcribe 可能会将您的媒体与德语匹配(de-DE)并制作德语转录。语言代码和口语不匹配可能会导致成绩单非常不准确,因此我们建议在选择语言代码时谨慎。

有关更多信息,请参阅通过批处理转录作业确定语言

要了解有关使用语言识别的监控和事件的信息,请参阅语言识别事件.