有关内置算法的常见信息 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

有关内置算法的常见信息

下表列出了 Amazon SageMaker 提供的每种算法的参数。

算法名称 渠道名称 训练输入模式 文件类型 实例类 可并行化
BlazingText 训练 文件或管道 文本文件(每行一句,带空格分隔的标记) GPU(仅单个实例) 或 CPU
DeepAR 预测 训练和 (可选) 测试 文件 JSON 行或 Parquet GPU 或 CPU
因子分解机 训练和 (可选) 测试 文件或管道 recordIO-protobuf CPU(对密集数据使用 GPU)
图像分类 训练和验证,(可选)train_lst、validation_lst 和模型 文件或管道 recordIO 或图像文件 (.jpg 或 .png) GPU
IP 见解 训练和 (可选) 验证 文件 CSV CPU 或 GPU
k-means 训练和 (可选) 测试 文件或管道 recordIO-protobuf 或 CSV CPU 或 GPUCommon(一个或多个实例上的单个 GPU 设备)
k-nearest-neighbor (k-NN) 训练和 (可选) 测试 文件或管道 recordIO-protobuf 或 CSV CPU 或 GPU(一个或多个实例上的单个 GPU 设备)

LDA

训练和 (可选) 测试 文件或管道 recordIO-protobuf 或 CSV CPU(仅单个实例)
线性学习器 训练和 (可选) 验证和/或测试 文件或管道 recordIO-protobuf 或 CSV CPU 或 GPU
神经主题模型 训练和 (可选) 验证和/或测试 文件或管道 recordIO-protobuf 或 CSV GPU 或 CPU
Object2Vec 训练和 (可选) 验证和/或测试 文件 JSON 行 GPU 或 CPU(仅单个实例)
对象检测 训练和验证,(可选)train_annotation、validation_annotation 和模型 文件或管道 recordIO 或图像文件 (.jpg 或 .png) GPU
PCA 训练和 (可选) 测试 文件或管道 recordIO-protobuf 或 CSV GPU 或 CPU
随机森林砍伐 训练和 (可选) 测试 文件或管道 recordIO-protobuf 或 CSV CPU
语义分割 训练和验证、train_annotation、validation_annotation 以及(可选)label_map 和模型 文件或管道 图像文件 GPU(仅单个实例)

Seq2Seq 建模

训练、验证和 vocab 文件 recordIO-protobuf GPU(仅单个实例)
XGBoost(0.90-1、0.90-2、1.0-1、1.2-1、1.2-21) 训练和 (可选) 验证 文件或管道 CSV、LibSVM 或实木复合地板 CPU(或者用于 1.2-1 的 GPU)

可并行化 的算法可部署在多个计算实例上以进行分布式训练。

以下主题提供有关 Docker 注册表路径、数据格式、推荐的 Amazon EC2 实例类型的信息以及 CloudWatch Amazon SageMaker 提供的所有内置算法的常见日志。