Vertica逻辑回归预测:输入列不可用

我正在尝试按照Vertica中内置函数的语法构建一个逻辑回归模型。模型构建得很好,但predictLogisticReg无法工作。

我可以使用以下代码构建模型:

SELECT     v_ml.logisticReg('logRegModel', 'public.regression_training_table',           'longTermPlayer', ' IOS_or_not, firstDayTransactions',          '--epsilon=0.000001 --max_iterations=100');

并通过检查摘要来验证它是否工作:

SELECT    v_ml.summaryLogisticReg(using parameters                model_name='logRegModel', owner='dbadmin');

当我尝试使用以下代码在测试集上预测特征时:

 SELECT      user_id,      v_ml.predictLogisticReg('IOS_or_not', 'firstDayTransactions'            using parameters model_name='logRegModel', owner='dbadmin') FROM public.regression_test_table

(测试集具有相同的列),我得到了以下错误:

The input column corresponding to "ios_or_not" is not available

如果你知道为什么它似乎无法识别测试集中的数据,我将非常感激!

谢谢。


回答:

已解决。对于感兴趣的人:我将字段放在了引号内,而它们本不应该这样。应替换为

SELECT     user_id,     v_ml.predictLogisticReg(IOS_or_not, firstDayTransactions        using parameters model_name='logRegModel', owner='dbadmin') FROM public.regression_test_table

Related Posts

### 理解gbm生存预测模型

我是一个使用和理解机器学习方法的新手,目前正在使用R语…

如何在特征少于原始训练数据集的数据集上使用标准化模型

我使用了来自sklearn.preprocessing…

网格搜索未能提供最佳参数

在对逻辑回归、线性SVM和K最近邻分类器的正则化强度倒…

使用GridSearchCV进行TF-IDF和Count向量化的参数调优

我想使用GridSearchCV来进行参数调优。Gri…

从DataFrame中减去前一组具有值的前一行的行

我有一个如下的Python pandas DataFr…

如何在Tensorflow / Keras中为包含多个标签的字典形式的数据集定义损失?

我有一个包含多个标签的数据集,我希望定义一个依赖于这些…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注