第4步: 使用自定义语言模型转录 - Amazon Transcribe
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

第4步: 使用自定义语言模型转录

您可以在转录作业中使用自定义语言模型, Amazon Transcribe 控制台, StartTranscriptionJob 操作,或 AWS CLI.

启动转录作业(控制台)

  1. 登录 AWS 管理控制台并通过 Amazon Transcribe 控制台打开 Amazon Transcribe 控制台。

  2. 在导航窗格中,选择转录作业

  3. 对于 名称,请输入AWS帐户中唯一的转录作业名称。

  4. 对于 模型选择,请选择您的自定义语言模型。

  5. 对于 输入S3上的文件位置,输入媒体文件的URI。如果您记不住URI,请选择 浏览S3 并选择。

  6. 选择下一步

  7. 为要使用的转录作业启用任何可用功能。

  8. 选择创建

启动转录作业 (API)

  1. 为所需参数指定值:

    • TranscriptionJobName -转录作业的名称。

    • LanguageCode -转录作业的语言代码。美国英语(美国)是唯一有效的语言代码。

    • MediaFileUri 参数 Media 对象- Amazon S3 要转录的媒体文件的位置。

    • LanguageModelName 参数 ModelSettings 对象-自定义语言模型的名称。

  2. 指定可选参数的值。以下代码显示必需和可选参数:

    { "JobExecutionSettings": { "AllowDeferredExecution": boolean, "DataAccessRoleArn": "string" }, "LanguageCode": "string", "Media": { "MediaFileUri": "string" }, "MediaFormat": "string", "MediaSampleRateHertz": number, "ModelSettings": { "LanguageModelName": "string" }, "OutputBucketName": "string", "OutputEncryptionKMSKeyId": "string", "Settings": { "ChannelIdentification": boolean, "MaxAlternatives": number, "MaxSpeakerLabels": number, "ProfanityCollectionName": "string", "ProfanityFilterMethod": "string", "ShowAlternatives": boolean, "ShowSpeakerLabels": boolean, "VocabularyName": "string" }, "TranscriptionJobName": "string" }

使用自定义语言模型转录(AWS CLI)

  • 运行以下代码。

    aws transcribe start-transcription-job \ --transcription-job-name "example-job-name" \ --language-code "en-US" \ --media MediaFileUri="s3://example-bucket/example-audio.wav" \ --model-settings LanguageModelName="ExampleLanguageModel"

下一步

第5步: 查看和更新您的自定义语言模型