使用医疗自定义词汇转录音频文件 - Amazon Transcribe
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用医疗自定义词汇转录音频文件

使用StartMedicalTranscriptionJob或者使用 Amazon Transcribe Medical 控制台来启动使用自定义词汇来提高转录准确性的转录作业。

要使用自定义词汇表开始转录作业 (控制台)

要使用控制台在转录作业中使用自定义词汇,请。

  1. 登录到Amazon Transcribe Medical 控制台.

  2. 在导航窗格中的 Amazon Transcribe Medical 下,选择转录作业.

  3. 选择创建任务

  4. 在存储库的指定作业详细信页面中,提供有关你的转录作业的信息。

  5. 选择下一步

  6. UNDER自定义,启用自定义词汇表.

  7. UNDER词汇表选择对于,选择自定义词汇表。

  8. 选择 Create (创建)

使用批量转录作业 (API) 识别音频文件中的扬声器

  • 对于StartMedicalTranscriptionJob在 API 中,指定以下内容。

    1. 适用于MedicalTranscriptionJobName在您的中,指定唯一的名称Amazon Web Services 账户.

    2. 适用于LanguageCode对于,指定与音频文件中所用语言和词汇表筛选条件的语言对应的语言代码。

    3. 对于MediaFileUri的参数Media对象中,指定要转录的音频文件的名称。

    4. 适用于Specialty,指定在音频文件中讲话的临床医生的医疗专业。

    5. 适用于Type中,指定音频文件是对话还是听写。

    6. 适用于OutputBucketName中,指定 Amazon Simple Storage Service (Amazon S3) 存储桶以存储转录结果。

    7. 对于Settings对象,请指定以下内容。

      1. VocabularyName— 自定义词汇表的名称。

以下请求使用Amazon SDK for Python (Boto3)用自定义词汇开始批量转录作业。

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "example-med-vocab-transcription" job_uri = "https://DOC-EXAMPLE-BUCKET1.s3-Region.amazonaws.com/example-audio-file.extension" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName=job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', OutputBucketName = 'DOC-EXAMPLE-BUCKET2', Settings = { 'VocabularyName': 'example-med-custom-vocab' } ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName=job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)