有关内置算法的常见信息 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

有关内置算法的常见信息

下表列出了 Amazon SageMaker 提供的每种算法的参数。

算法名称 渠道名称 训练输入模式 文件类型 实例类 可并行化
AutoGluon-Tabular 训练和(可选)验证 文件 CSV GPU 或 CPU(仅单个实例)
BlazingText 训练 文件或管道 文本文件(每行一句,带空格分隔的令牌) GPU 或 CPU(仅单个实例)
CatBoost 训练和(可选)验证 文件 CSV CPU(仅单个实例)
DeepAR 预测 训练和 (可选) 测试 文件 JSON 行或 Parquet CPU 或 GPU
因子分解机 训练和 (可选) 测试 文件或管道 recordIO-protobuf CPU(对密集数据使用 GPU)
图像分类 – MXNet 训练和验证,(可选)train_lst、validation_lst 和模型 文件或管道 recordIO 或图像文件 (.jpg 或 .png) GPU
图像分类 – TensorFlow 训练和验证 文件 图像文件(.jpg、.jpeg 或 .png) CPU 或 GPU 是(仅适用于单实例上的多 GPU)
IP 洞察 训练和 (可选) 验证 文件 CSV CPU 或 GPU
K-Means 训练和 (可选) 测试 文件或管道 recordIO-protobuf 或 CSV CPU 或 GPUCommon(一个或多个实例上的单个 GPU 设备)
K 最近邻 (k-NN) 训练和 (可选) 测试 文件或管道 recordIO-protobuf 或 CSV CPU 或 GPU(一个或多个实例上的单个 GPU 设备)
LDA 训练和 (可选) 测试 文件或管道 recordIO-protobuf 或 CSV CPU(仅单个实例)
LightGBM 训练和(可选)验证 文件 CSV CPU
线性学习器 训练和 (可选) 验证和/或测试 文件或管道 recordIO-protobuf 或 CSV CPU 或 GPU
神经主题模型 训练和 (可选) 验证和/或测试 文件或管道 recordIO-protobuf 或 CSV CPU 或 GPU
Object2Vec 训练和 (可选) 验证和/或测试 文件 JSON 行 GPU 或 CPU(仅单个实例)
对象检测 – MXNet 训练和验证,(可选)train_annotation、validation_annotation 和模型 文件或管道 recordIO 或图像文件 (.jpg 或 .png) GPU
对象检测 – TensorFlow 训练和验证 文件 图像文件(.jpg、.jpeg 或 .png) GPU 是(仅适用于单实例上的多 GPU)
PCA 训练和 (可选) 测试 文件或管道 recordIO-protobuf 或 CSV CPU 或 GPU
Random Cut Forest 训练和 (可选) 测试 文件或管道 recordIO-protobuf 或 CSV CPU
语义分割 训练和验证、train_annotation、validation_annotation 以及(可选)label_map 和模型 文件或管道 图像文件 GPU(仅单个实例)
Seq2Seq 建模 训练、验证和 vocab 文件 recordIO-protobuf GPU(仅单个实例)
TabTransformer 训练和(可选)验证 文件 CSV GPU 或 CPU(仅单个实例)
文本分类 – TensorFlow 训练和验证 文件 CSV CPU 或 GPU 是(仅适用于单实例上的多 GPU)
XGBoost(0.90-1、0.90-2、1.0-1、1.2-1、1.2-21) 训练和 (可选) 验证 文件或管道 CSV、LibSVM 或 Parquet CPU(对于 1.2-1 为 GPU)

可并行化 的算法可部署在多个计算实例上以进行分布式训练。

以下主题提供了有关数据格式、推荐的 Amazon EC2 实例类型以及 Amazon SageMaker 提供的所有内置算法通用的 CloudWatch 日志等信息。

注意

要查找 SageMaker 管理的内置算法的 Docker 映像 URI,请参阅 Docker 注册表路径和示例代码