StartMedicalStreamTranscription - 转录
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

StartMedicalStreamTranscription

注意

并非所有地区都支持 Amazon Transcribe Medical。

启动双向 HTTP/2 或 WebSocket 流式传输,其中音频将流式传输到 Amazon Transcribe Medical,并且转录结果将流式传输到您的应用程序。

以下参数为必需参数:

  • language-code

  • media-encoding

  • sample-rate

有关使用 Amazon Transcribe Medical 进行直播的更多信息,请参阅转录流媒体音频

请求语法

POST /medical-stream-transcription HTTP/2 x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "AudioStream": { "AudioEvent": { "AudioChunk": blob } } }

URI 请求参数

请求使用以下 URI 参数。

ContentIdentificationType

标记您的成绩单中标明的所有个人医疗信息 (PHI)。

内容识别是在片段级别上进行的;PHI 在音频片段完成转录后会被标记。

有关更多信息,请参阅识别转录中的个人健康信息 (PHI)

有效值: PHI

EnableChannelIdentification

在多声道音频中启用频道识别。

频道识别可单独转录每个通道上的音频,然后将每个通道的输出附加到一个脚本中。

如果您有多声道音频但未启用频道识别,则您的音频将以连续的方式转录,并且您的转录不会按频道分隔。

如果您在请求EnableChannelIdentification中包含内容,则还必须包括NumberOfChannels

有关更多信息,请参阅转录多声道音频

LanguageCode

指定代表音频中所说语言的语言代码。

重要

Amazon Transcribe Medical 仅支持美国英语 (en-US)。

有效值: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

必需:是

MediaEncoding

指定用于输入音频的编码。支持的格式为:

  • FLAC

  • Ogg 容器中的 Opus 编码音频

  • PCM(仅限签名的 16 位小端音频格式,不包括 WAV)

有关更多信息,请参阅媒体格式

有效值: pcm | ogg-opus | flac

必需:是

MediaSampleRateHertz

输入音频的采样率(以赫兹为单位)。Amazon Transcribe Medical 支持从 16,000 Hz 到 48,000 Hz 不等的频率。请注意,您指定的采样率必须与音频的采样率相匹配。

有效范围:最小值为 8000。最大值为 48000。

必需:是

NumberOfChannels

指定音频流中的通道数量。此值必须为2,因为仅支持两个通道。如果您的音频不包含多个频道,请不要在请求中包含此参数。

如果您在请求NumberOfChannels中包含内容,则还必须包括EnableChannelIdentification

有效范围:最小值为 2。

SessionId

为您的转录会话指定一个名称。如果您在请求中未包含此参数,Amazon Transcribe Medical 会生成一个 ID 并在响应中将其返回。

长度限制:固定长度为 36。

模式:[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

在转录输出中启用扬声器分区(分音)。扬声器分区会标记媒体文件中单个扬声器的语音。

有关更多信息,请参阅对扬声器进行分区(分区)

Specialty

指定音频中包含的医学专业。

有效值: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

必需:是

Type

指定输入音频的类型。例如,选择DICTATION提供者口述患者记录,选择患者与CONVERSATION医疗专业人员之间的对话。

有效值: CONVERSATION | DICTATION

必需:是

VocabularyName

指定处理转录时要使用的自定义词汇的名称。请注意,词汇名称区分大小写。

长度限制:最小长度为 1。最大长度为 200。

模式:^[0-9a-zA-Z._-]+

请求正文

请求接受采用 JSON 格式的以下数据。

AudioStream

经过编码的音频 blob 流。音频流编码为 HTTP/2 或 WebSocket 数据帧。

有关更多信息,请参阅转录流式音频

类型:AudioStream 对象

必需:是

响应语法

HTTP/2 200 x-amzn-request-id: RequestId x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "TranscriptResultStream": { "BadRequestException": { }, "ConflictException": { }, "InternalFailureException": { }, "LimitExceededException": { }, "ServiceUnavailableException": { }, "TranscriptEvent": { "Transcript": { "Results": [ { "Alternatives": [ { "Entities": [ { "Category": "string", "Confidence": number, "Content": "string", "EndTime": number, "StartTime": number } ], "Items": [ { "Confidence": number, "Content": "string", "EndTime": number, "Speaker": "string", "StartTime": number, "Type": "string" } ], "Transcript": "string" } ], "ChannelId": "string", "EndTime": number, "IsPartial": boolean, "ResultId": "string", "StartTime": number } ] } } } }

响应元素

如果此操作成功,则该服务将会发送回 HTTP 200 响应。

响应将返回以下 HTTP 标头。

ContentIdentificationType

显示您的转录是否启用了内容识别。

有效值: PHI

EnableChannelIdentification

显示您的转录是否启用了频道识别。

LanguageCode

提供您在请求中指定的语言代码。必须是 en-US

有效值: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

MediaEncoding

提供您在请求中指定的媒体编码。

有效值: pcm | ogg-opus | flac

MediaSampleRateHertz

提供您在请求中指定的采样率。

有效范围:最小值为 8000。最大值为 48000。

NumberOfChannels

提供您在请求中指定的频道数量。

有效范围:最小值为 2。

RequestId

为您的直播请求提供标识符。

SessionId

为您的转录会话提供标识符。

长度限制:固定长度为 36。

模式:[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

显示您的转录是否启用了扬声器分区。

Specialty

提供您在申请中指定的医学专业。

有效值: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

Type

提供您在请求中指定的音频类型。

有效值: CONVERSATION | DICTATION

VocabularyName

提供您在请求中指定的自定义词汇表的名称。

长度限制:最小长度为 1。最大长度为 200。

模式:^[0-9a-zA-Z._-]+

服务以 JSON 格式返回的以下数据。

TranscriptResultStream

提供有关您的流式传输会话的详细信息。

类型:MedicalTranscriptResultStream 对象

错误

有关所有操作常见错误的信息,请参阅常见错误

BadRequestException

StartStreamTranscriptionStartMedicalStreamTranscriptionStartCallAnalyticsStreamTranscription操作的一个或多个参数无效。例如,MediaEncodingLanguageCode使用了不支持的值。检查指定的参数,然后重试您的请求。

HTTP 状态代码:400

ConflictException

一个新的直播以相同的会话 ID 开始。当前直播已终止。

HTTP 状态代码:409

InternalFailureException

处理音频时出现问题。Amazon Transcribe 已终止处理。

HTTP 状态代码:500

LimitExceededException

您的客户已超过Amazon Transcribe 其中一个限制。这通常是音频长度限制。将您的音频流分成小块,然后重试您的请求。

HTTP 状态代码:429

ServiceUnavailableException

服务目前无法使用。稍后尝试您的请求。

HTTP 状态代码:503

另请参阅

有关在特定语言的 Amazon 软件开发工具包中使用此 API 的更多信息,请参阅以下内容: