本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
有关内置算法的常见信息
下表列出了 Amazon SageMaker 提供的每种算法的参数。
算法名称 | 渠道名称 | 训练输入模式 | 文件类型 | 实例类 | 可并行化 |
---|---|---|---|---|---|
BlazingText | 训练 | 文件或管道 | 文本文件(每行一句,带空格分隔的标记) | GPU(仅单个实例) 或 CPU | 否 |
DeepAR 预测 | 训练和 (可选) 测试 | 文件 | JSON 行或 Parquet | GPU 或 CPU | 是 |
因子分解机 | 训练和 (可选) 测试 | 文件或管道 | recordIO-protobuf | CPU(对密集数据使用 GPU) | 是 |
图像分类 | 训练和验证,(可选)train_lst、validation_lst 和模型 | 文件或管道 | recordIO 或图像文件 (.jpg 或 .png) | GPU | 是 |
IP 见解 | 训练和 (可选) 验证 | 文件 | CSV | CPU 或 GPU | 是 |
k-means | 训练和 (可选) 测试 | 文件或管道 | recordIO-protobuf 或 CSV | CPU 或 GPUCommon(一个或多个实例上的单个 GPU 设备) | 否 |
k-nearest-neighbor (k-NN) | 训练和 (可选) 测试 | 文件或管道 | recordIO-protobuf 或 CSV | CPU 或 GPU(一个或多个实例上的单个 GPU 设备) | 是 |
LDA |
训练和 (可选) 测试 | 文件或管道 | recordIO-protobuf 或 CSV | CPU(仅单个实例) | 否 |
线性学习器 | 训练和 (可选) 验证和/或测试 | 文件或管道 | recordIO-protobuf 或 CSV | CPU 或 GPU | 是 |
神经主题模型 | 训练和 (可选) 验证和/或测试 | 文件或管道 | recordIO-protobuf 或 CSV | GPU 或 CPU | 是 |
Object2Vec | 训练和 (可选) 验证和/或测试 | 文件 | JSON 行 | GPU 或 CPU(仅单个实例) | 否 |
对象检测 | 训练和验证,(可选)train_annotation、validation_annotation 和模型 | 文件或管道 | recordIO 或图像文件 (.jpg 或 .png) | GPU | 是 |
PCA | 训练和 (可选) 测试 | 文件或管道 | recordIO-protobuf 或 CSV | GPU 或 CPU | 是 |
随机森林砍伐 | 训练和 (可选) 测试 | 文件或管道 | recordIO-protobuf 或 CSV | CPU | 是 |
语义分割 | 训练和验证、train_annotation、validation_annotation 以及(可选)label_map 和模型 | 文件或管道 | 图像文件 | GPU(仅单个实例) | 否 |
Seq2Seq 建模 |
训练、验证和 vocab | 文件 | recordIO-protobuf | GPU(仅单个实例) | 否 |
XGBoost(0.90-1、0.90-2、1.0-1、1.2-1、1.2-21) | 训练和 (可选) 验证 | 文件或管道 | CSV、LibSVM 或实木复合地板 | CPU(或者用于 1.2-1 的 GPU) | 是 |
可并行化 的算法可部署在多个计算实例上以进行分布式训练。
以下主题提供有关 Docker 注册表路径、数据格式、推荐的 Amazon EC2 实例类型的信息以及 CloudWatch Amazon SageMaker 提供的所有内置算法的常见日志。