转录医疗对话的音频文件 - Amazon Transcribe
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

转录医疗对话的音频文件

使用批量转录作业来转录医疗对话的音频文件。你可以用它来转录临床医生与患者对话。你可以在StartMedicalTranscriptionJobAPI 或 Amazon Transcribe 医疗控制台。

在开始医疗转录作业时StartMedicalTranscriptionJobAPI,你指定PRIMARYCARE作为的价值Specialty参数。

转录临床医生患者对话(控制台)

要使用控制台转录临床医生与患者对话,请创建转录作业并选择对话为了音频输入类型.

  1. 登录到Amazon Transcribe Medical.

  2. 在导航窗格中的 Amazon Transcribe Medical 下,选择转录作业.

  3. 选择创建任务

  4. 在存储库的指定作业细节页面,下Job 设置,请指定以下内容。

    1. 名称— 转录作业的名称。

    2. 音频输入类型对话

  5. 对于其余字段,请指定音频文件的 Amazon Simple Storage Service (Amazon S3) 位置以及要存储转录作业输出的位置。

  6. 选择 Next (下一步)

  7. 选择创建

要使用批处理转录作业 (API) 来转录医疗对话

  • 对于StartMedicalTranscriptionJobAPI,指定以下内容。

    1. 适用于MedicalTranscriptionJobName在您的中指定唯一性的名称Amazon Web Services 账户.

    2. 适用于LanguageCode对于,指定与音频文件中所用语言和词汇筛选条件的语言对应的语言代码。

    3. 对于MediaFileUri的参数Media对象中,指定要转录的音频文件的名称。

    4. 适用于Specialty中,将在音频文件中讲话的临床医生的医疗专业指定为PRIMARYCARE.

    5. 对于 Type,请指定 CONVERSATION

    6. 适用于OutputBucketName中,指定 Amazon Simple Storage Service (Amazon S3) 存储桶来存储转录结果。

    以下是一个示例请求,该请求使用Amazon SDK for Python (Boto3)转录临床医生的医学谈话PRIMARYCARE专业和病人。

    from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "medical-conversation-transcription-job-name" job_uri = "s3://DOC-EXAMPLE-BUCKET1/example-audio-file.extension" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', OutputBucketName = 'DOC-EXAMPLE-BUCKET2' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName=job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

以下示例代码显示了临床医生与患者对话的转录结果。

{ "jobName": "conversation-medical-transcription-job", "accountId": "453794026688", "results": { "transcripts": [ { "transcript": "... come for a follow up visit today..." } ], "items": [ { ... "start_time": "4.85", "end_time": "5.12", "alternatives": [ { "confidence": "1.0", "content": "come" } ], "type": "pronunciation" }, { "start_time": "5.12", "end_time": "5.29", "alternatives": [ { "confidence": "1.0", "content": "for" } ], "type": "pronunciation" }, { "start_time": "5.29", "end_time": "5.33", "alternatives": [ { "confidence": "0.9955", "content": "a" } ], "type": "pronunciation" }, { "start_time": "5.33", "end_time": "5.66", "alternatives": [ { "confidence": "0.9754", "content": "follow" } ], "type": "pronunciation" }, { "start_time": "5.66", "end_time": "5.75", "alternatives": [ { "confidence": "0.9754", "content": "up" } ], "type": "pronunciation" }, { "start_time": "5.75", "end_time": "6.02", "alternatives": [ { "confidence": "1.0", "content": "visit" } ] ... }, "status": "COMPLETED" }

要使用批量转录作业转录医疗对话(Amazon CLI)

  • 运行以下代码。

    aws transcribe start-medical-transcription-job \ –-cli-input-json file://example-start-command.json

    以下代码显示的是example-start-command.json.

    { "MedicalTranscriptionJobName": "conversation-medical-transcription-job", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"the-S3-bucket-where-you-output-the-transcription-results", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET1/example-audio-file.extension" } }

    以下是运行前面的 CLI 命令的响应。

    { "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "example-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "en-US", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET1/example-audio-file.extension" }, "StartTime": "2020-10-05T20:43:39.583000+00:00", "CreationTime": "2020-10-05T20:43:39.547000+00:00", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }