Amazon Transcribe
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

入门 (AWS Command Line Interface)

在以下练习中,您将使用 AWS Command Line Interface (AWS CLI) 将语音转录为文本。要完成此练习,您需要:

要转录文本,您必须在 JSON 文件中提供输入参数。

转录文本

  1. 将输入语音复制到 S3 存储桶。存储位置必须与您要调用的终端节点位于同一区域。此示例假定文件位于名为 test-transcribe 的 S3 存储桶中,文件名是 answer2.wav

  2. 创建名为 test-start-command.json 的 JSON 文件,其中包含 StartTranscriptionJob 操作的输入参数。

    { "TranscriptionJobName": "request ID", "LanguageCode": "en-US", "MediaFormat": "wav", "Media": { "MediaFileUri": "https://S3 endpoint/test-transcribe/answer2.wav" } }
  3. 在 AWS CLI 中运行以下命令。此示例的格式适用于 Unix、Linux 和 macOS。对于 Windows,请将每行末尾的反斜杠 (\) Unix 行继续符替换为脱字号 (^)。

    aws transcribe start-transcription-job \ --region region \ --cli-input-json file://test-start-command.json

    Amazon Transcribe 使用以下内容做出响应:

    { "TranscriptionJob": { "TranscriptionJobName": "request ID", "LanguageCode": "en-US", "TranscriptionJobStatus": "IN_PROGRESS", "Media": { "MediaFileUri": "https://S3 endpoint/test-transcribe/answer2.wav" }, "CreationTime": timestamp, "MediaFormat": "wav" } }

列出转录任务

  • 运行以下命令:

    aws transcribe list-transcription-jobs \ --region region \ --status IN_PROGRESS

    Amazon Transcribe 使用以下内容做出响应:

    { "Status": "IN_PROGRESS", "TranscriptionJobSummaries": [ { "TranscriptionJobName": "request ID", "LanguageCode": "en-US", "CreationTime": timestamp, "TranscriptionJobStatus": "IN_PROGRESS" } ] }

获得转录任务的结果

  1. 任务的状态为 COMPLETED 时可获得任务的结果。键入以下命令:

    aws transcribe get-transcription-job \ --region region \ --transcription-job-name "request ID"

    Amazon Transcribe 使用以下内容做出响应:

    { "TranscriptionJob": { "TranscriptionJobName": "request ID", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "Media": { "MediaFileUri": "input URI" }, "CreationTime": timestamp, "CompletionTime": timestamp, "Transcript": { "TranscriptFileUri": "output URI" } } }
  2. 使用输出 URI 来获取音频文件的转录文本。以下是一段简短的音频剪辑转录的输出:

    { "jobName":"job ID", "accountId":"account ID", "results": { "transcripts":[ { "transcript":" that's no answer" } ], "items":[ { "start_time":"0.180", "end_time":"0.470", "alternatives":[ { "confidence":0.84, "content":"that's" } ], "type": "pronunciation" }, { "start_time":"0.470", "end_time":"0.710", "alternatives":[ { "confidence":0.99, "content":"no" } ], "type": "pronunciation" }, { "start_time":"0.710", "end_time":"1.080", "alternatives":[ { "confidence":0.874, "content":"answer" } ], "type": "pronunciation" } ] }, "status":"COMPLETED" }