Batch 转录概述 - Amazon Transcribe
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Batch 转录概述

提供美国英语版本 Amazon Transcribe Medical 批处理转录。它可以转录非母语者说出的带口音英语。它支持转录单个音频文件。您可以使用控制台或直接 API 调用启动转录作业。

您可以使用四个主要 API 资源与 Amazon Transcribe Medical 进行交互。要开始医疗转录作业,请使用StartMedicalTranscriptionJobAPI。要检索有关医疗转录作业的信息,请使用 GetMedicalTranscriptionJob。您使用 ListMedicalTranscriptionJobs 列出医疗转录作业。您使用 DeleteMedicalTranscriptionJob 删除医疗转录作业。

要转录音频文件,您可以使用转录作业。您将文件作为对象存储在 Amazon Simple Storage Service (S3) 存储桶中。输入文件必须为:

  • FLAC、MP3、MP4 或 WAV 文件格式。

  • 使用 16 位线性 PCM 编码。

  • 时长少于 4 小时且大小小于 2 GB

  • 使用 16000 Hz 或更高的采样速率

要获得最佳效果:

  • 使用无损格式,如 FLAC 或 WAV。

创建医疗转录作业时,您需要指定源文件的语言、医学专业和音频类型。您输入美国英语作为语言,并输入 PRIMARYCARE 作为医学专业。输入初级保健作为值使可让您从以下医学专业的源音频生成转录:

  • 家庭医疗

  • 内科

  • 妇产科 (OB-GYN)

  • 儿科

您可以选择口述和对话作为您的音频类型。对于医生在其中报告有关患者就诊或手术的音频文件选择口述。对于涉及医生与患者之间对话或医生之间对话的音频文件选择对话。

要存储转录作业的输出,请选择您已创建的 Amazon S3 存储桶。有关 S3 存储桶的更多信息,请参阅 Amazon Simple Storage Service 入门

以下是要在示例 JSON 中输入的最小请求参数的数量。

{ "MedicalTranscriptionJobName": "job-name", "LanguageCode": "en-US", "Media": { "MediaFileUri": "s3://path to your audio file" }, "OutputBucketName": “your output bucket name", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" }

使用 Amazon Transcribe Medical,您可以生成备选转录。有关更多信息,请参阅生成替代转录

您还可以在音频中识别不同的扬声器或频道。有关更多信息,请参阅识别演讲者并标记他们的演讲转录多声道音频