IP 洞察推理数据格式 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

IP 洞察推理数据格式

以下是 IP 洞察算法的可用输入和输出格式。Amazon SageMaker 内置算法遵循 用于推理的常见数据格式 中所述的常见输入推理格式。但是,SageMaker IP 洞察算法当前不支持 RecordIO 格式。

IP 洞察输入请求格式

输入:CSV 格式

CSV 文件一定具有两个列。第一列是对应于实体的唯一标识符的不透明字符串。第二列是十进制点表示法中实体访问事件的 IPv4 地址。

content-type: text/csv

entity_id_1, 192.168.1.2 entity_id_2, 10.10.1.2

输入:JSON 格式

JSON 数据可以采用不同的格式提供。IP 洞察遵循常见的 SageMaker 格式。有关推理格式的更多信息,请参阅用于推理的常见数据格式

content-type: application/json

{ "instances": [ {"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]} ] }

输入:JSONLINES 格式

JSON 行内容类型对于运行批量转换作业非常有用。有关 SageMaker 推理格式的更多信息,请参阅用于推理的常见数据格式。有关运行批量转换作业的更多信息,请参阅使用批量转换

content-type: application/jsonlines

{"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]}]

IP 洞察输出响应格式

输出:JSON 响应格式

SageMaker IP 洞察算法的默认输出是输入实体与 IP 地址之间的 dot_product。dot_product 表示模型认为实体与 IP 地址之间的相容程度。dot_product 是无界的。要预测某个事件是否异常,您需要根据定义的分布设置阈值。有关如何使用 dot_product 进行异常检测的信息,请参阅 SageMaker IP 洞察算法简介

accept: application/json

{ "predictions": [ {"dot_product": 0.0}, {"dot_product": 2.0} ] }

高级用户可以通过向 Accept 标题提供额外的 content-type 参数 verbose=True,访问模型已经学习的实体和 IP 嵌入。您可以将 entity_embeddingip_embedding 用于调试、可视化和了解模型。此外,您可以在其他机器学习技术(例如分类或聚类)中使用这些嵌入。

accept: application/json;verbose=True

{ "predictions": [ { "dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0] }, { "dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0] } ] }

输出:JSONLINES 响应格式

accept: application/jsonlines

{"dot_product": 0.0} {"dot_product": 2.0}

accept: application/jsonlines; verbose=True

{"dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0]} {"dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0]}