生成替代转录 - Amazon Transcribe
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

生成替代转录

当您使用 Amazon Transcribe ter Medical 转录时,您会获得具有最高置信度的转录。但是,您可以配置 Amazon Trancriter Medical 转录,以返回置信度较低的其他转录。

使用备选转录可查看对所转录音频的不同解释。例如,在允许用户查看转录的应用程序中,您可以提供备选转录供用户选择。

您可以使用 Amazon Transcribe 医疗控制台或StartMedicalTranscriptionJobAPI。

在转录作业中生成其他替代转录(控制台)

要使用控制台生成备用转录,您可以在配置作业时启用备选结果。

  1. 登录到卓越 Amazon Transcribe 医疗控制台.

  2. 在导航窗格中的 Amazon Trancriter Medical Medical Medical Trancriter Cedical转录作业.

  3. 选择 Create job (创建任务)

  4. 在存储库的指定作业详细信息页面上,提供有关您的转录作业的信息。

  5. 选择 Next (下一步)

  6. 启用替代结果.

  7. 适用于最大替代方法中,输入介于 2 到 10 之间的整数值,以获得输出中想要的备用转录的最大数量。

  8. 选择创建

使用批量转录作业 (API) 识别音频文件中的扬声器

  • 对于StartMedicalTranscriptionJobAPI 中,指定以下内容。

    1. 适用于MedicalTranscriptionJobName中,指定在Amazon Web Services 账户.

    2. 适用于LanguageCode中,指定与音频文件中所用语言和词汇筛选条件的语言对应的语言代码。

    3. MediaFileUri参数Media对象中,指定要转录的音频文件的名称。

    4. 适用于Specialty,指定在音频文件中讲话的临床医生的医疗专业。

    5. 适用于Type中,指定您是在转录医疗会话还是听写。

    6. 适用于OutputBucketName中,指定 Amazon Simple Storage Service (Amazon S3) 存储桶来存储转录结果。

    7. 对于Settings对象中,指定以下内容。

      1. ShowAlternativestrue.

      2. MaxAlternatives-一个介于 2 到 10 之间的整数,用于指示您希望在转录输出中的替代转录数量。

以下请求使用Amazon SDK for Python (Boto3)启动转录作业,最多可生成两个备用转录。

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "your-transcription-job-name" job_uri = s3://DOC-EXAMPLE-BUCKET1/example-audio-file.extension transcribe.start_medical_transcription_job( MedicalTranscriptionJobName=job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'type', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation. OutputBucketName = 'Amazon-S3-bucket-name-storing-your-transcription-results' ), Settings = {'ShowAlternatives': True, 'MaxAlternatives': 2 } while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName=job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

将初级医疗临床医生与患者之间对话的音频文件转录为音频文件,并确定每个人在转录输出中所说的内容(Amazon CLI)

  • 运行以下代码。

    aws transcribe start-transcription-job \ --cli-input-json file://filepath/example-start-command.json

    以下代码显示example-start-command.json.

    { "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }

    以下是运行前面的 CLI 命令的响应。

    { "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "alternatives-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "en-US", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T19:09:18.199000+00:00", "CreationTime": "2020-09-21T19:09:18.171000+00:00", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 2 }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }