我想知道在数学上是否有可能从给定的多个样本输入向量中预测输出数值。
我实在不知道该如何解释,所以我会举个例子:向量将是这样的[学习小时数,睡眠小时数],输出是学校考试的分数:
x.train(100, [5, 8])x.train(0, [0, 0])x.predict([2.5, 4]) // 应该返回50(因为输入是前者的二分之一)x.predict([5, 8]) // 应该返回100x.predict([0, 0]) // 应该返回0
如果我的解释不够清楚,很抱歉…如果你能理解我的意思,你知道有哪些Python或PHP库可以做到这一点吗?能提供一个使用示例吗?
非常感谢你,祝你有美好的一天!
回答:
你可以使用scikit-learn
来实现:
from sklearn import linear_modelclf = linear_model.LinearRegression()clf.fit([[5, 8], [0 , 0]], [100, 0])print(clf.predict([[2.5, 4], [5, 8], [0, 0]]))
你应该注意过拟合/欠拟合的风险。你可能需要考虑使用多项式特征,这将增加模型的复杂性,从而提高预测的准确性,但不要选择过于复杂的特征(在这种情况下是高次多项式),因为这肯定会导致过拟合。尝试通过交叉验证在两者之间找到一个平衡点。