Amazon Transcribe
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

通道识别

如果一个音频文件包含您要转录为不同转录内容(用于识别包含语音的通道)的多个通道,请使用通道识别。例如,如果您在一个通道上有一位客户支持代表,在另一个通道上有一位客户,请使用通道识别创建一个由每个通道识别的转录和包含通道的单个转录。

Amazon Transcribe 将您的音频文件拆分为多个通道并且分别转录这些通道。在转录所有通道后,Amazon Transcribe 还将合并这些转录以创建单独转录。它会返回单个结果文件中的所有转录内容。

发言者的表达按其开始时间排序。表达 是一种音频通道上的语音单位,通常用静默与其他表达隔开。如果一个通道上的表达与另一个通道上的表达重叠,Amazon Transcribe 将在转录中按其开始时间对其进行排序。在输入音频中重叠的表达不会在转录输出中重叠。

您可以在 Amazon Transcribe 控制台中或使用 API 启用通道识别。在控制台中,在创建转录任务时选择 Channel identification (通道识别)。如果您使用 API,请在调用 StartTranscriptionJob 操作时设置 ChannelIdentification 标志。

以下是两个通道上某个对话的简短输出:

{ "jobName": "job id", "accountId": "account id", "results": { "transcripts": [ { "transcript": "When you try ... It seems to ..." } ], "channel_labels": { "channels": [ { "channel_label": "ch_0", "items": [ { "start_time": "12.282", "end_time": "12.592", "alternatives": [ { "confidence": "1.0000", "content": "When" } ], "type": "pronunciation" }, { "start_time": "12.592", "end_time": "12.692", "alternatives": [ { "confidence": "0.8787", "content": "you" } ], "type": "pronunciation" }, { "start_time": "12.702", "end_time": "13.252", "alternatives": [ { "confidence": "0.8318", "content": "try" } ], "type": "pronunciation" }, Transcription abbreviated ] }, { "channel_label": "ch_1", "items": [ { "start_time": "12.379", "end_time": "12.589", "alternatives": [ { "confidence": "0.5645", "content": "It" } ], "type": "pronunciation" }, { "start_time": "12.599", "end_time": "12.659", "alternatives": [ { "confidence": "0.2907", "content": "seems" } ], "type": "pronunciation" }, { "start_time": "12.669", "end_time": "13.029", "alternatives": [ { "confidence": "0.2497", "content": "to" } ], "type": "pronunciation" }, Transcription abbreviated ] } }