最近我遇到一个问题,我认为SciPy可能是一个很好的解决方案。然而,我一直无法正确应用它。我不确定是遗漏了什么,还是我想要做的事情实际上根本不可能实现。
这是一个虚构的例子,我是为了让事情更清楚、更容易可视化而制作的。我的情况要复杂得多。
from sklearn.model_selection import train_test_split from sklearn.svm import SVRfrom scipy.optimize import minimizeimport numpy as npimport pandas as pdtime_studied = [12, 10, 4, 7, 6, 11, 6]hours_slept = [8, 7, 1, 3, 8, 6, 5]grade = [10, 9, 2, 5, 7, 8, 8.5, 6]X = np.array([time_studied, hours_slept]).Ty = np.array([grade]).T X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) model = SVR(kernel='poly', C=100, gamma='auto', degree=3, epsilon=.1, coef0=1)model.fit(X,y)
然后,我试图将优化器应用于该函数,以找到睡眠和学习之间的最佳平衡。由于测试的回归方法返回一个函数,我猜想应该可以应用SciPy的minimize函数。但当我尝试这样做时,像这样
bnds = [(0,12), (0,8)]x0 = [0,0]residual_plant = minimize(model, x0, method='SLSQP',bounds=bnds,options = {'eps': np.radians(5.0)})
我得到了以下错误
TypeError: 'SVR' object is not callable
显然,不能直接从我的模型中调用优化器。因此,我的疑问是,如何访问拟合到我的数据上的函数,并能够找到最佳的睡眠+学习时间与成绩(在这种情况下,预期结果是显而易见的)
我遗漏了什么吗?我想要做的事情是可能的吗?
回答:
试试这个:
residual_plant = minimize(lambda x: model.predict(np.array([x])), x0, method='SLSQP',bounds=bnds,options = {'eps': np.radians(5.0)})
SciPy的minimize
函数的第一个参数并不是简单地model.predict
,因为SciPy试图将其目标函数传递给一个一维数组,但model.predict
期望一个二维数组。
(顺便说一下,在你虚构模型的训练设置中,y
是X
的第二列,而grades
列表从未使用过。我怀疑y
应该是np.array([grades]).T
。由于这不是你真正的模型,这可能不是关键问题。)
predict
方法的参考文档:https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVR.html?highlight=svr#sklearn.svm.SVR.predict
predict
方法的一个使用示例在这里可以找到:https://scikit-learn.org/stable/auto_examples/svm/plot_svm_regression.html#sphx-glr-auto-examples-svm-plot-svm-regression-py