AWS Machine Learning 从 S3 创建 DataSource 时出现错误

我在尝试从 S3 自动创建 AWS DataSource 时遇到了错误:我正在运行一个 shell 脚本:

#!/bin/bash for k in 1 2 3 4 5 do        aws machinelearning create-data-source-from-s3 --cli-input-json file://data/cfg/dsrc_training_00$k.json        aws machinelearning create-data-source-from-s3 --cli-input-json file://data/cfg/dsrc_validate_00$k.json done

以下是它引用的 JSON 文件示例:

{   "DataSourceId": "Iris_training_00{k}",   "DataSourceName": "[DS Iris] training 00{k}",   "DataSpec": {      "DataLocationS3": "s3://ml-test-predicto-bucket/shuffled_{k}.csv",      "DataSchemaLocationS3": "s3://ml-test-predicto-bucket/dsrc_iris.csv.schema",      "DataRearrangement": {"splitting":{"percentBegin" : 0, "percentEnd" : 70}}   },   "ComputeStatistics": true}

但是当我在命令行运行我的脚本时,我得到了以下错误:

Parameter validation failed:Invalid type for parameter DataSpec.DataRearrangement, value: {u'splitting': {u'percentEnd': u'100', u'percentBegin': u'70'}}, type: <type 'dict'>, valid types: <type 'basestring'>

请问有人可以帮忙吗?我已经查看了 AWS ML 的 API 文档,我认为我做得一切正确,但似乎无法解决这个错误…非常感谢!


回答:

DataRearrangement 元素期望一个 JSON 字符串 对象。你传递的是一个 字典 对象。

更改:

"DataRearrangement": {"splitting":{"percentBegin" : 0, "percentEnd" : 70}}

[改为]

"DataRearrangement": "{\"splitting\":{\"percentBegin\":0,\"percentEnd\":70}}"

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注