AWS机器学习中只有两种内置的预测/分类模型:逻辑回归和线性回归。当前版本的AWS ML是否有可能做到以下几点:
1) 重建逻辑回归和线性回归模型的底层实现
2) 用Python/R编写自己的模型,实现并在AWS ML上运行,如神经网络、随机森林、聚类算法等?
在AWS ML开发者指南的最新版本中,我没有找到明确的答案,表明这些是不可能实现的。有什么建议吗?
回答:
先了解一些背景…
Amazon Machine Learning可以为三种机器学习问题构建模型(二元/多类分类和回归)。如您之前提到的,平台选择并训练的模型对用户来说是抽象的。
这种“黑盒”实现可能是Amazon机器学习平台最大的缺陷。您无法了解模型是如何训练的(除了例如线性回归,随机梯度下降
之外)。Amazon明确表示这是有意为之,因为他们希望平台能够被集成到应用程序中,而不仅仅是用来训练模型。请参见这个问答的47:25和53:30处。
那么,回答您的问题:
- 您无法看到模型是如何被训练的,例如线性回归中的常数是什么(尽管您可以通过测试模型来推断)。当您查询模型时,响应中包含一个字段,指示用于该特定模型的算法(例如SGD)。完整的学习算法列表可以在这里找到。
- 不幸的是,不行。您无法创建自己的模型并将其导入到AWS机器学习中,这意味着无法在平台上运行决策树或神经网络模型。