使用自动语言识别转录 - Amazon Transcribe
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用自动语言识别转录

您可以在批量转录作业中使用自动语言标识, Amazon Transcribe 控制台或 StartTranscriptionJob 操作。

使用自动语言标识启动转录作业(控制台)

  1. 登录 AWS 管理控制台 并打开 Amazon Transcribe 控制台位于 Amazon转录控制台.

  2. 在导航窗格中,选择转录作业

  3. 对于 语言设置,选择 自动语言识别.

  4. (可选)适用于 自动语言识别的语言选项- 可选,选择您想要转录的文件中存在的任何语言。

  5. 对于 输入S3上的文件位置,低于 输入数据,输入您的媒体文件的URI,或在 浏览S3 搜索框。

  6. 对于 数据位置,低于 输出数据,选择您想用来存储转录输出的S3bucket的ype。

  7. 选择下一步

  8. 选择创建

使用自动语言标识(API)启动转录作业

StartTranscriptionJob 操作中,指定以下内容:

  • 对于 TranscriptionJobName,请指定AWS帐户中唯一的名称。

  • MediaFileUri 参数 Media 对象,指定要转录的媒体文件的S3对象位置。

  • IdentifyLanguage 参数设置为 true.

  • (可选)为了提高语言识别的准确性,请在中输入您文件中使用的语言阵列 LanguageOptions。例如,如果您确信您的媒体文件使用美国英语、美国西班牙语或法语,请提供以下阵列: ["en-US", "es-US", "fr-FR"].

不为指定一个值 LanguageCode 参数。这样做会产生 BadRequestException 错误。

如果您为 LanguageOptions 参数, Amazon Transcribe 显示了您在转录作业的输出中指定的语言的语言代码及其相关的置信度分数。音频以置信度得分最高的语言转录。以下示例转录输出显示 en-GBde-DE 是 指定的 LanguageOptions.

{ "jobName": "your-transcription-job", "accountId": "your-account-id", "results": { "language_code": "en-GB", "transcripts": [ { "transcript": "So I see. Supposed to show some overeager squatting with an itchy trigger finger, that's who. [transcription output shortened for brevity] You know why? Why? Because I love it." } ], "language_identification": [ { "score": "0.9883", "code": "en-GB" }, { "score": "0.0117", "code": "de-DE" } ], "items": [ { "start_time": "1.51", "end_time": "1.83", "alternatives": [ { "confidence": "0.9464", "content": "so" } ], "type": "pronunciation" }, ... { "start_time": "95.19", "end_time": "95.4", "alternatives": [ { "confidence": "1.0", "content": "love" } ], "type": "pronunciation" }, { "start_time": "95.4", "end_time": "95.6", "alternatives": [ { "confidence": "1.0", "content": "it" } ], "type": "pronunciation" }, { "alternatives": [ { "confidence": "0.0", "content": "." } ], "type": "punctuation" } ] }, "status": "COMPLETED" }

如果您没有指定一组语言,则答案将列出具有五个最高置信度分数的语言的语言代码和相关置信度分数。将以下示例响应与上一个示例中的输出进行比较。

{ ... "language_identification": [ { "score": "0.6888", "code": "en-GB" }, { "score": "0.1875", "code": "en-AU" }, { "score": "0.059", "code": "en-IE" }, { "score": "0.0436", "code": "en-AB" }, { "score": "0.0212", "code": "en-US" } ], ... }

Amazon Transcribe 始终以置信度得分最高的语言转录音频。

有关用于启动批处理转录作业的请求参数及其数据类型的更多信息,请参阅 StartTranscriptionJob

在中启用自动语言标识启动转录作业 AWS CLI,请使用以下 命令。

aws transcribe start-transcription-job \ --media MediaFileUri=s3:///your-media-file.mp4 \ --identify-language \ --transcription-job-name your-transcription-job-name

查找转录作业的确定语言

查看语言代码及其置信度分数 进行转录作业,其中你已经识别了语言, 使用 GetTranscriptionJob 操作。您可以在处理期间检索有关转录作业的此信息。您无需等待转录完成即可获得此信息。以下 AWS CLI 请求获得关于特定转录作业的信息,如示例响应中所示。

aws transcribe get-transcription-job \ --transcription-job-name your-transcription-job
{ "TranscriptionJob": { "TranscriptionJobName": "your-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "de-DE", "MediaSampleRateHertz": 48000, "MediaFormat": "mp4", "Media": { "MediaFileUri": "s3://media-file-uri-location" }, "Transcript": { "TranscriptFileUri": "https://transcript-file-uri-location" }, "StartTime": 1599750586.471, "CreationTime": 1599750586.433, "CompletionTime": 1599751075.505, "Settings": { "ChannelIdentification": false, "ShowAlternatives": false }, "IdentifyLanguage": true, "IdentifiedLanguageScore": 0.929964542388916 } }

要列出已启用自动语言标识的转录作业,请使用 是 ListTranscriptionJobs 操作. Thelanguagethat Amazon Transcribe 以语言代码表示 LanguageCode 参数。对于启用自动语言标识的转录作业, IdentifiedLanguageScore 参数表示 Amazon Transcribe 是 识别了正确的语言. 其值介于0和1之间,其中0表示无置信度,1表示绝对置信度。以下 AWS CLI 命令将返回类似于所示响应的响应。

aws transcribe list-transcription-jobs
{ "TranscriptionJobSummaries": [ { "TranscriptionJobName": "your-transcription-job", "CreationTime": 1598970220.096, "StartTime": 1598970220.14, "CompletionTime": 1598970276.861, "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET", "IdentifyLanguage": true, "IdentifiedLanguageScore": 0.8672199249267578 } ] }