我正在考虑使用AWS的机器学习AMI来训练一些深度网络,因为这些网络在我的硬件设置上运行得太慢了。
然而,我目前看到了两个可能的主要问题,这些问题可能会使这个选项变得不那么有趣甚至不可能。
训练数据不是CSV格式,而是nifti格式的图像。在AWS的描述中,数据必须是.csv格式的。
此外,常见问题解答中提到,训练好的模型无法提取。这意味着所有后续的推理和测试都必须依赖于AWS中的实例吗?
这两个问题都是真实的吗?
回答:
是的,我认为只能使用CSV格式的训练数据:http://docs.aws.amazon.com/machine-learning/latest/dg/step-1-download-edit-and-upload-data.htmlAWS机器学习数据源最后还有来自其他产品的数据通常可以导出到Amazon S3中的CSV文件,使其可供Amazon机器学习使用
目前似乎只有CSV格式,我自己也觉得有点 frustrating…
是的,正如机器学习常见问题解答所指示的:
问:我可以将我的模型从Amazon机器学习中导出吗?
答:不可以。
所以,目前为止,没有办法保存你的模型…你可以创建一个C5.large(计算优化)实例,并安装所有你机器学习项目所需的Python库。然后使用scikit-learn的功能来保存你的模型。如果C5.large不够用,你可以轻松地扩展它,只需为这个实例使用EBS存储即可。
希望这个验证对你有帮助