在音频文件中识别 PHI - Amazon Transcribe
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在音频文件中识别 PHI

使用批量抄录作业来转录音频文件并识别其中的个人健康信息 (PHI). 当您激活个人 Health 信息 (PHI) 识别时,Amazon Transcribe 医疗会为其在转录结果中识别的 PHI 贴标。有关 Amazon Transcribe 医疗可以识别的 PHI 的信息,请参阅在转录中识别个人健康信息 (PHI).

您可以使用StartMedicalTranscriptionJobAPI 或亚马逊医疗转录控制台。

要使用控制台转录临床医生与患者对话,请创建转录作业,然后选择对话对于 来说为音频输入类型.

转录音频文件并确定其 PHI(console)

  1. 登录到Amazon Transcribe edical Medical 控制台.

  2. 在导航窗格中的 Amazon Simple Medical 转录下,选择转录作业.

  3. 选择 Create job (创建任务)

  4. 在存储库的指定作业详细信息页面,在Job 设置,请指定以下内容。

    1. 名称— 转录作业的名称,该名称对于您的Amazon Web Services 账户.

    2. 音频输入类型对话或者听写.

  5. 对于其余字段,请指定音频文件的 Amazon Simple Storage Service (Amazon S3) 位置以及您希望存储转录作业输出的位置。

  6. 选择 Next (下一步)

  7. UNDER音频设置中,选择PHI 标识.

  8. 选择创建

使用批量转录作业 (API) 转录音频文件并识别其 PHI

  • 对于StartMedicalTranscriptionJobAPI 中,请指定以下内容。

    1. 适用于MedicalTranscriptionJobName、指定唯一的名称Amazonaccount.

    2. 适用于LanguageCode中,指定与音频文件中所用语言对应的语言代码。

    3. 对于MediaFileUriMedia对象中,指定要转录的音频文件的名称。

    4. 适用于Specialty,指定在音频文件中讲话的临床医生的医疗专业为PRIMARYCARE.

    5. 适用于Type,请指定CONVERSATION或者DICTATION.

    6. 适用于OutputBucketName中,指定要在其中存储转录结果的 Amazon Simple Storage Service (Amazon S3 存储桶。

    以下是使用Amazon SDK for Python (Boto3)来转录音频文件并识别患者的 PHI。

    from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "medical-conversation-transcription-job-name" job_uri = "s3://DOC-EXAMPLE-BUCKET1/example-audio-file.extension" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', ContentIdentificationType = 'PHI', Specialty = 'PRIMARYCARE', Type = 'type', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation. OutputBucketName = 'DOC-EXAMPLE-BUCKET2' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName=job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

以下示例代码显示了识别患者 PHI 的转录结果。

{ "jobName": "transcription-job-name", "accountId": "account-id", "results": { "transcripts": [{ "transcript": "The patient's name is Bertrand." }], "items": [{ "start_time": "0.0", "end_time": "0.37", "alternatives": [{ "confidence": "0.9993", "content": "The" }], "type": "pronunciation" }, { "start_time": "0.37", "end_time": "0.44", "alternatives": [{ "confidence": "0.9981", "content": "patient's" }], "type": "pronunciation" }, { "start_time": "0.44", "end_time": "0.52", "alternatives": [{ "confidence": "1.0", "content": "name" }], "type": "pronunciation" }, { "start_time": "0.52", "end_time": "0.92", "alternatives": [{ "confidence": "1.0", "content": "is" }], "type": "pronunciation" }, { "start_time": "0.92", "end_time": "0.9989", "alternatives": [{ "confidence": "1.0", "content": "Bertrand" }], "type": "pronunciation" }, { "alternatives": [{ "confidence": "0.0", "content": "." }], "type": "punctuation" }], "entities": [{ "content": "Bertrand", "category": "PHI*-Personal*", "startTime": 0.92, "endTime": 1.2, "confidence": 0.9989 }], }, "status": "COMPLETED" }

要转录音频文件并使用批处理转录作业确定 PHI (Amazon CLI)

  • 运行以下命令代码。

    aws transcribe start-medical-transcription-job \ --medical-transcription-job-name job-name\ --language-code en-US \ --media MediaFileUri="s3://your-S3-bucket/S3-prefix/your-filename.file-extension" \ --output-bucket-name DOC-EXAMPLE-BUCKET2 \ --specialty PRIMARYCARE \ --type type \ # Choose CONVERSATION to transcribe a medical conversation. Choose DICTATION to transcribe a medical dictation. --content-identification-type PHI

    以下是运行前面的 CLI 命令的响应。

    { "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "job-name", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "en-US", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET1/example-audio-file.extension" }, "StartTime": "2021-04-27T22:21:52.505000+00:00", "CreationTime": "2021-04-27T22:21:52.459000+00:00", "ContentIdentificationType": "PHI", "Specialty": "PRIMARYCARE", "Type": "type" } }