我在尝试从 S3 自动创建 AWS DataSource 时遇到了错误:我正在运行一个 shell 脚本:
#!/bin/bash for k in 1 2 3 4 5 do aws machinelearning create-data-source-from-s3 --cli-input-json file://data/cfg/dsrc_training_00$k.json aws machinelearning create-data-source-from-s3 --cli-input-json file://data/cfg/dsrc_validate_00$k.json done
以下是它引用的 JSON 文件示例:
{ "DataSourceId": "Iris_training_00{k}", "DataSourceName": "[DS Iris] training 00{k}", "DataSpec": { "DataLocationS3": "s3://ml-test-predicto-bucket/shuffled_{k}.csv", "DataSchemaLocationS3": "s3://ml-test-predicto-bucket/dsrc_iris.csv.schema", "DataRearrangement": {"splitting":{"percentBegin" : 0, "percentEnd" : 70}} }, "ComputeStatistics": true}
但是当我在命令行运行我的脚本时,我得到了以下错误:
Parameter validation failed:Invalid type for parameter DataSpec.DataRearrangement, value: {u'splitting': {u'percentEnd': u'100', u'percentBegin': u'70'}}, type: <type 'dict'>, valid types: <type 'basestring'>
请问有人可以帮忙吗?我已经查看了 AWS ML 的 API 文档,我认为我做得一切正确,但似乎无法解决这个错误…非常感谢!
回答:
DataRearrangement 元素期望一个 JSON 字符串 对象。你传递的是一个 字典 对象。
更改:
"DataRearrangement": {"splitting":{"percentBegin" : 0, "percentEnd" : 70}}
[改为]
"DataRearrangement": "{\"splitting\":{\"percentBegin\":0,\"percentEnd\":70}}"