转录医疗听写的音频文件 - Amazon Transcribe
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

转录医疗听写的音频文件

使用批量转录作业来转录医疗对话的音频文件。您可以使用它来转录临床医生-患者对话。您可以启动批量转录作业StartMedicalTranscriptionJobAPI 或亚马逊医疗转录控制台。

当您开始医疗转录作业时,使用StartMedicalTranscriptionJobAPI,您可以指定PRIMARYCARE作为Specialty参数。

转录临床医生-患者对话(控制台)

要使用控制台转录临床医生与患者对话,请创建转录作业,然后选择对话对于 来说为音频输入类型.

  1. 登录到Amazon Transcribe Medical 控制台.

  2. 在导航窗格中的 Amazon Transcribe Medical 下,选择转录作业.

  3. 选择 Create job (创建任务)

  4. 在存储库的指定任务详细信息页面,在Job 设置,请指定以下内容。

    1. 名称― 转录作业的名称。

    2. 音频输入类型听写

  5. 对于其余字段,请指定音频文件的 Amazon Simple Storage Service (Amazon S3) 位置以及您希望存储转录作业输出的位置。

  6. 选择 Next (下一步)

  7. 选择创建

使用批处理转录作业 (API) 转录医疗对话

  • 对于StartMedicalTranscriptionJobAPI 中,指定以下内容。

    1. 适用于MedicalTranscriptionJobName中,在Amazon Web Services 账户.

    2. 适用于LanguageCode中,指定与音频文件中所用语言和词汇表筛选条件的语言对应的语言代码。

    3. MediaFileUri参数Media对象中,指定要转录的音频文件的名称。

    4. 适用于Specialty,指定在音频文件中讲话的临床医生的医疗专业。

    5. 对于 Type,请指定 DICTATION

    6. 适用于OutputBucketName中,指定 Amazon Simple Storage Service (Amazon S3) 存储桶以存储转录结果。

    以下是一个示例请求,该请求使用Amazon SDK for Python (Boto3)转录临床医生的医疗听写PRIMARYCARE专业。

    from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "your-medical-conversation-transcription-job-name" job_uri = "s3://DOC-EXAMPLE-BUCKET1/example-audio-file.extension" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'DICTATION', OutputBucketName = 'DOC-EXAMPLE-BUCKET1' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName=job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

以下示例代码显示了医疗听写的转录结果。

{ "jobName": "dictation-medical-transcription-job", "accountId": "account-id-number", "results": { "transcripts": [ { "transcript": "... came for a follow up visit today..." } ], "items": [ { ... "start_time": "4.85", "end_time": "5.12", "alternatives": [ { "confidence": "1.0", "content": "came" } ], "type": "pronunciation" }, { "start_time": "5.12", "end_time": "5.29", "alternatives": [ { "confidence": "1.0", "content": "for" } ], "type": "pronunciation" }, { "start_time": "5.29", "end_time": "5.33", "alternatives": [ { "confidence": "0.9955", "content": "a" } ], "type": "pronunciation" }, { "start_time": "5.33", "end_time": "5.66", "alternatives": [ { "confidence": "0.9754", "content": "follow" } ], "type": "pronunciation" }, { "start_time": "5.66", "end_time": "5.75", "alternatives": [ { "confidence": "0.9754", "content": "up" } ], "type": "pronunciation" }, { "start_time": "5.75", "end_time": "6.02", "alternatives": [ { "confidence": "1.0", "content": "visit" } ] ... }, "status": "COMPLETED" }

要使用批量转录作业识别音频文件中的扬声器(Amazon CLI)

  • 运行以下代码。

    aws transcribe start-medical-transcription-job \ --cli-input-json file://filepath/example-start-command.json

    以下代码显示的是example-start-command.json.

    { "MedicalTranscriptionJobName": "conversation-medical-transcription-job", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET1/example-audio-file.extension" } }

    以下是运行前面的 CLI 命令的响应。

    { "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "example-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "en-US", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET1/example-audio-file.extension" }, "StartTime": "2020-09-20T00:35:22.256000+00:00", "CreationTime": "2020-09-20T00:35:22.218000+00:00", "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }