部分结果稳定 - Amazon Transcribe
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

部分结果稳定

一旦您开始流式传输音频,Amazon Transcrcribe 就开始返回转录结果。它返回这些部分结果以递增方式直到在自然语音段落级别产生最终结果为止。自然语音片段是连续的语音,由于音频暂停或扬声器的变化而分解。对于每个语音段落,这些部分结果中的任何单词或短语都可能会改变。Amazon Transcribe 会继续输出部分结果,直到为语音片段生成最终转录结果。

您可以使用部分结果稳定来生成不太可能改变的部分转录结果。如果激活部分结果稳定化,则只有部分结果中的最后几个单词可以更改。

启用部分结果稳定功能会改变 Amazon Transcribe 生成最终转录结果的方式。由于只有最后几个单词可以在部分结果之间更改,因此激活部分结果稳定化可能会影响转录准确性。

部分结果稳定可缩短呈现转录结果所需的时间。部分结果稳定还允许您选择更改要显示的文本量。您可以在 HTTP/2 或 WebSocket 流中使用部分结果稳定功能。

当您使用 Amazon Transcribe 开始直播时,每个语音片段都有两种选择:

  • 等待最终结果。

  • 在转录输出中使用部分结果

使用部分结果可减少延迟。这种延迟的减少可能有助于使用案例,例如为视频添加字幕或为直播生成字幕。您可以使用部分结果稳定功能更快地向观众展示转录结果。

使用部分结果稳定功能,您可以选择转录输出中不会更改的部分。您还可以使用它向观众展示更易于阅读的字幕。通过显示部分结果,您还可以限制在给定时间显示的文本量。

以下文本显示了在未激活部分结果稳定的情况下,随着 Amazon Transcribe 理流,转录输出可能会发生什么变化。最后一行代表最终结果。之前的行代表部分结果。

And if you held onto the ships and if you held onto the shift and if you hold onto the shift key and if you hold onto the shift keys

以下文本显示了激活部分结果稳定后,随着 Amazon Transcribe 理流,转录输出可能会发生什么变化。最后一行代表最终结果。之前的行代表部分结果。

and if you hold onto the ships and if you hold onto the shift and if you hold onto the shift key and if you hold onto the shift keys

除了启用部分结果稳定之外,您还可以更改转录结果的稳定性级别。稳定性级别决定了你希望转录结果的稳定程度。稳定性水平越高意味着 Amazon Transcribe 返回的转录结果不太可能发生变化。此设置的整体转录准确度低于稳定性水平的准确性。较低的稳定性水平会产生更准确的转录结果,但这些结果更有可能改变。

在中使用部分结果稳定HTTP/2 请求

以下是一个参数的语法形式。已激活部分结果稳定的 HTTP/2 请求。

POST /stream-transcription HTTP/2 x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod x-amzn-transcribe-language-model-name: LanguageModelName x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization x-amzn-transcribe-partial-results-stability: PartialResultsStability Content-type: application/json

要激活 HTTP/2 流中的部分结果稳定,请使用StartStreamTranscription通过 API 指定以下内容:

  • LanguageCode— T语言代码这与直播中使用的语言相对应。有关流式转录中可用的语言的列表,请参阅。什么是 Amazon Transcribe?.

  • MediaSampleHertz— 音频的采样率。

  • EnablePartialResultsStabilizationtrue.

  • PartialResultsStability(可选)— 转录结果的稳定性级别。有效值包括 highmediumlow。在稳定级别之间,high随着直播的进展,稳定级别的局部结果最不可能发生变化。这些区域有:low稳定性级别显示部分结果,这些结果最有可能随着直播的进展而发生变化,但这些结果的总体准确度最高。如果您没有指定值,则使用 Amazon Transcribe 使用high.

使用部分结果稳定WebSocket 流

要在 WebSocket 流中使用部分结果稳定功能,请使用以下格式创建预签名 URL 以启动 WebSocket 请求并指定以下内容:

GET wss://transcribestreaming.region.amazonaws.com:8443/stream-transcription-websocket ?language-code=languageCode &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=Signature Version 4 credential scope &X-Amz-Date=date &X-Amz-Expires=time in seconds until expiration &X-Amz-Security-Token=security-token &X-Amz-Signature=Signature Version 4 signature &X-Amz-SignedHeaders=host &media-encoding=mediaEncoding &sample-rate=mediaSampleRateHertz &session-id=sessionId &enable-partial-results-stabilization=true &partial-results-stability=stability-level

预签名 URL 包含在您的应用程序与 Amazon Transcribe 之间建立双向通信的信息。

要激活部分结果稳定,请指定以下参数:

  • enable-partial-results-stabilizationtrue

  • partial-results-stability(可选)— 转录结果的稳定性级别。有效值包括 highmediumlow。在稳定级别之间,high随着直播的进展,稳定级别的局部结果最不可能发生变化。这些区域有:low稳定性级别显示部分结果,这些结果最有可能随着直播的进展而发生变化,但这些结果的总体准确度最高。如果您没有指定值,则使用 Amazon Transcribe 使用high.

有关完成 WebSocket 请求的更多信息,请参阅。创建预签名 URL.

流式转录输出

为了清楚起见,以下是移除元数据的流式处理请求的示例响应。

"Transcript": { "Results": [ { ... "Alternatives": [ { "Items": [ ... { "Content": "and", "EndTime": 1.02, "StartTime": 0.98, "Type": "pronunciation", "VocabularyFilterMatch": false, "Stable": true }, { "Content": "if", "EndTime": 1.26, "StartTime": 1.03, "Type": "pronunciation", "VocabularyFilterMatch": false, "Stable": true }, { "Content": "you", "EndTime": 1.41, "StartTime": 1.27, "Type": "pronunciation", "VocabularyFilterMatch": false, "Stable": true }, { "Content": "hold", "EndTime": 1.81, "StartTime": 1.42, "Type": "pronunciation", "VocabularyFilterMatch": true, "Stable": true }, { "Content": "onto", "EndTime": 2.11, "StartTime": 1.82, "Type": "pronunciation", "VocabularyFilterMatch": true, "Stable": true }, { "Content": "the", "EndTime": 2.32, "StartTime": 2.12, "Type": "pronunciation", "VocabularyFilterMatch": true, "Stable": true }, { "Content": "shift", "EndTime": 2.56, "StartTime": 2.33, "Type": "pronunciation", "VocabularyFilterMatch": true, "Stable": true } { "Content": "key", "EndTime": 2.81, "StartTime": 2.57, "Type": "pronunciation", "VocabularyFilterMatch": true, "Stable": false } ... ] } ] } ] }

当您激活部分结果稳定时,Amazon Transcribe 会使用Stable字段以指示是否项目非常稳定。物品是转录的单词或短语。您可以使用Stable字段以包括或删除稳定级别之间不稳定的项目,high随着直播的进展,稳定级别的局部结果最不可能发生变化。这些区域有:low稳定性级别显示部分结果,这些结果最有可能随着直播的进展而发生变化,但这些结果的总体准确度最高。