StartMedicalStreamTranscription - Amazon Transcribe
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

StartMedicalStreamTranscription

启动双向 HTTP/2 流,其中音频将流式传输到 Amazon Transcribe Medical,并且转录结果将流式传输到您的应用程序。

请求语法

POST /medical-stream-transcription HTTP/2 x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "AudioStream": { "AudioEvent": { "AudioChunk": blob } } }

URI 请求参数

请求使用以下 URI 参数。

ContentIdentificationType

将此字段设置为PHI在转录输出中识别个人健康信息。

有效值: PHI

EnableChannelIdentification

何时true,指示 Amazon Transcribe Medical 分别处理每个音频频道,然后将每个频道的转录输出合并为单个转录。

Amazon Transcribe Medical 还会为每件商品制作转录。项目包括开始时间、结束时间和任何替代转录。

不能同时设置这两项操作ShowSpeakerLabelEnableChannelIdentification在同一请求中。如果两者都设置,则您的请求将返回BadRequestException.

LanguageCode

指示输入音频流中使用的源语言。对于 Amazon Transcribe 医疗,则为美国英语 (en-US)。

有效值: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN

:必需 是

MediaEncoding

用于输入音频的编码。

有效值: pcm | ogg-opus | flac

:必需 是

MediaSampleRateHertz

输入音频的采样率,以 Hz 为单位。

有效范围:最小值为 8000。最大值为 48000。

:必需 是

NumberOfChannels

音频流中的频道数量。

有效范围:最小值为 2。

SessionId

可选。转录会话的标识符。如果您未提供会话 ID,Amazon Transcribe 为您生成一个并在响应中返回它。

约束:固定长度为 36。

模式:[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

何时true,启用实时流中的扬声器识别功能。

Specialty

临床医生或提供者的医疗专业。

有效值: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

:必需 是

Type

输入音频的类型。选择DICTATION对于听写患者笔记的提供者而言。选择CONVERSATION用于患者和一名或多名医疗专业人员之间的对话。

有效值: CONVERSATION | DICTATION

:必需 是

VocabularyName

处理实时流时使用的医学自定义词汇表的名称。

约束:最小长度为 1。最大长度为 200。

模式:^[0-9a-zA-Z._-]+

请求正文

请求接受采用 JSON 格式的以下数据。

AudioStream

表示从应用程序到 Amazon Transcribe 的音频流。

类型:AudioStream 对象

:必需 是

响应语法

HTTP/2 200 x-amzn-request-id: RequestId x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "TranscriptResultStream": { "BadRequestException": { }, "ConflictException": { }, "InternalFailureException": { }, "LimitExceededException": { }, "ServiceUnavailableException": { }, "TranscriptEvent": { "Transcript": { "Results": [ { "Alternatives": [ { "Entities": [ { "Category": "string", "Confidence": number, "Content": "string", "EndTime": number, "StartTime": number } ], "Items": [ { "Confidence": number, "Content": "string", "EndTime": number, "Speaker": "string", "StartTime": number, "Type": "string" } ], "Transcript": "string" } ], "ChannelId": "string", "EndTime": number, "IsPartial": boolean, "ResultId": "string", "StartTime": number } ] } } } }

响应元素

如果此操作成功,则该服务将会发送回 HTTP 200 响应。

响应将返回以下 HTTP 标头。

ContentIdentificationType

如果值是PHI,表示您已将直播配置为标识个人健康信息。

有效值: PHI

EnableChannelIdentification

显示是否在直播中启用了频道识别功能。

LanguageCode

响应成绩单的语言代码。对于 Amazon Transcribe 医疗,则为美国英语 (en-US)。

有效值: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN

MediaEncoding

输入音频流使用的编码。

有效值: pcm | ogg-opus | flac

MediaSampleRateHertz

输入音频的采样率,以 Hz 为单位。

有效范围:最小值为 8000。最大值为 48000。

NumberOfChannels

直播中识别的频道数量。

有效范围:最小值为 2。

RequestId

串流转录的标识符。

SessionId

可选。转录会话的标识符。如果您未提供会话 ID,Amazon Transcribe 为您生成一个并在响应中返回它。

约束:固定长度为 36。

模式:[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

显示直播中是否启用了扬声器识别功能。

Specialty

医疗领域的专业。

有效值: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

Type

转录的音频类型。

有效值: CONVERSATION | DICTATION

VocabularyName

处理流时使用的词汇表的名称。

约束:最小长度为 1。最大长度为 200。

模式:^[0-9a-zA-Z._-]+

服务以 JSON 格式返回的以下数据。

TranscriptResultStream

表示从 Amazon Transcribe Medical 到您的应用程序的转录事件。

类型:MedicalTranscriptResultStream 对象

Errors

有关所有操作中常见的错误的信息,请参阅常见错误.

BadRequestException

一个或多个参数StartStreamTranscription要么StartMedicalStreamTranscription操作无效。例如,MediaEncoding未设置为有效的编码,或者LanguageCode未设置为有效的代码。检查参数并再次尝试请求。

HTTP 状态代码:400

ConflictException

一个新的直播以相同的会话 ID 开始。当前直播已被终止。

HTTP 状态代码:409

InternalFailureException

处理音频时出现问题。Amazon Transcribe 或 Amazon Transcribe 医疗已终止处理。请再次尝试您的请求。

HTTP 状态代码:500

LimitExceededException

您已超过并发转录流的最大数量、启动转录流的速度太快,或者最大音频长度为 4 小时。等到直播完成处理,或者将音频流分成更小的块,然后再试一次请求。

HTTP 状态代码:429

ServiceUnavailableException

当前不可用此服务。稍后尝试您的请求。

HTTP 状态代码:503

另请参阅

有关在特定语言的Amazon软件开发工具包中使用此 API 的更多信息,请参阅以下内容: