Step Functions 如何解析输入 CSV 文件

管理状态和转换数据

Step Functions 根据以下规则解析文本分隔文件：

分隔字段的分隔符由 in 指定。CSVDelimiter ReaderConfig分隔符默认为 COMMA。
换行符是分隔记录的分隔符。
字段被视为字符串。对于数据类型转换，使用 ItemSelector（Map）中的 States.StringToJson 内置函数。
不需要使用双引号（" "）将字符串括起来。但是，用双引号括起来的字符串可以包含逗号和换行符，但不用作记录分隔符。
可以通过重复双引号来保留双引号。
反斜杠（\）是另一种转义特殊字符的方法。反斜杠只能与其他反斜杠、双引号以及配置的字段分隔符（如逗号或竖线）配合使用。后跟任何其他字符的反斜杠会被静默移除。
可以通过重复使用反斜杠来保留反斜杠。例如：
```
path,size
C:\\Program Files\\MyApp.exe,6534512
```
转义双引号的反斜杠 (\") 仅在成对出现时才有效，因此建议通过重复使用双引号来转义双引号：""。
如果一行中的字段数少于标题中的字段数，Step Functions 会为缺失的值提供空字符串。
如果一行中的字段数多于标题中的字段数，Step Functions 会跳过多余的字段。

解析输入 CSV 文件的示例

假设您提供了一个名为 myCSVInput.csv 的 CSV 文件，其中包含一行作为输入。然后，您已将此文件存储在名为 amzn-s3-demo-bucket 的 Amazon S3 存储桶中。该 CSV 文件如下所示。


abc,123,"This string contains commas, a double quotation marks (""), and a newline (
)",{""MyKey"":""MyValue""},"[1,2,3]"

以下状态机读取此 CSV 文件，并使用 ItemSelector（Map）来转换某些字段的数据类型。


{
  "StartAt": "Map",
  "States": {
    "Map": {
      "Type": "Map",
      "ItemProcessor": {
        "ProcessorConfig": {
          "Mode": "DISTRIBUTED",
          "ExecutionType": "STANDARD"
        },
        "StartAt": "Pass",
        "States": {
          "Pass": {
            "Type": "Pass",
            "End": true
          }
        }
      },
      "End": true,
      "Label": "Map",
      "MaxConcurrency": 1000,
      "ItemReader": {
        "Resource": "arn:aws:states:::s3:getObject",
        "ReaderConfig": {
          "InputType": "CSV",
          "CSVHeaderLocation": "GIVEN",
          "CSVHeaders": [
            "MyLetters",
            "MyNumbers",
            "MyString",
            "MyObject",
            "MyArray"
          ]
        },
        "Parameters": {
          "Bucket": "amzn-s3-demo-bucket",
          "Key": "myCSVInput.csv"
        }
      },
      "ItemSelector": {
        "MyLetters.$": "$$.Map.Item.Value.MyLetters",
        "MyNumbers.$": "States.StringToJson($$.Map.Item.Value.MyNumbers)",
        "MyString.$": "$$.Map.Item.Value.MyString",
        "MyObject.$": "States.StringToJson($$.Map.Item.Value.MyObject)",
        "MyArray.$": "States.StringToJson($$.Map.Item.Value.MyArray)"
      }
    }
  }
}

当您运行这个状态机时，它会产生以下输出。


[
  {
    "MyNumbers": 123,
    "MyObject": {
      "MyKey": "MyValue"
    },
    "MyString": "This string contains commas, a double quote (\"), and a newline (\n)",
    "MyLetters": "abc",
    "MyArray": [
      1,
      2,
      3
    ]
  }
]

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

ResultWriter

集成服务