我正在尝试按照Vertica中内置函数的语法构建一个逻辑回归模型。模型构建得很好,但predictLogisticReg
无法工作。
我可以使用以下代码构建模型:
SELECT v_ml.logisticReg('logRegModel', 'public.regression_training_table', 'longTermPlayer', ' IOS_or_not, firstDayTransactions', '--epsilon=0.000001 --max_iterations=100');
并通过检查摘要来验证它是否工作:
SELECT v_ml.summaryLogisticReg(using parameters model_name='logRegModel', owner='dbadmin');
当我尝试使用以下代码在测试集上预测特征时:
SELECT user_id, v_ml.predictLogisticReg('IOS_or_not', 'firstDayTransactions' using parameters model_name='logRegModel', owner='dbadmin') FROM public.regression_test_table
(测试集具有相同的列),我得到了以下错误:
The input column corresponding to "ios_or_not" is not available
如果你知道为什么它似乎无法识别测试集中的数据,我将非常感激!
谢谢。
回答:
已解决。对于感兴趣的人:我将字段放在了引号内,而它们本不应该这样。应替换为
SELECT user_id, v_ml.predictLogisticReg(IOS_or_not, firstDayTransactions using parameters model_name='logRegModel', owner='dbadmin') FROM public.regression_test_table