IP 见解推理数据格式 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

IP 见解推理数据格式

下面是 IP 见解算法的可用输入和输出格式。Amazon SageMaker 内置算法遵循用于推理的常见数据格式. 但是,SageMaker IP 见解算法当前不支持 RecordIO 格式。

IP 见解输入请求格式

输入:CSV 格式

CSV 文件一定具有两个列。第一列是与实体的唯一标识符对应的不透明字符串。第二列是十进制点表示法中实体访问事件的 IPv4 地址。

content-type:text/csv

entity_id_1, 192.168.1.2 entity_id_2, 10.10.1.2

输入:JSON 格式

JSON 数据可以以不同格式提供。IP 见解遵循常见的 SageMaker 格式。有关推理格式的更多信息,请参阅用于推理的常见数据格式.

content-type: application/json

{ "instances": [ {"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]} ] }

输入:JSONLINFlow 格式

JSON 行内容类型对于运行批处理转换作业非常有用。有关 SageMaker 推理格式的详细信息,请参阅用于推理的常见数据格式. 有关运行批量转换作业的详细信息,请参阅使用批量转换获取整个数据集的推理.

content-type: application/jsonlines

{"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]}]

IP 见解输出响应格式

输出: JSON 响应格式

SageMaker IP 见解算法的默认输出是dot_product输入实体和 IP 地址之间的值。dot_product 表示模型考虑实体和 IP 地址的兼容性。这些区域有:dot_product是无界的。要预测事件是否异常,您需要根据定义的分布设置阈值。有关如何使用dot_product有关异常检测的信息,请参阅SageMakerIP 洞察算法简介.

accept: application/json

{ "predictions": [ {"dot_product": 0.0}, {"dot_product": 2.0} ] }

高级用户可以通过提供附加的内容类型参数访问模型的学习实体和 IP 嵌入verbose=True添加到 “接受” 标题。您可以使用entity_embeddingip_embedding用于调试、可视化和理解模型。此外,您可以在其他机器学习技术(如分类或聚类)中使用这些嵌入。

Acceptation=true

{ "predictions": [ { "dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0] }, { "dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0] } ] }

输出: JSONLINES 响应格式

accept: application/jsonlines

{"dot_product": 0.0} {"dot_product": 2.0}

accept: applict/jsonlines; 冗长 = true

{"dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0]} {"dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0]}