机器学习:从输入向量预测输出数值的”匹配”训练

我想知道在数学上是否有可能从给定的多个样本输入向量中预测输出数值。

我实在不知道该如何解释,所以我会举个例子:向量将是这样的[学习小时数,睡眠小时数],输出是学校考试的分数:

x.train(100, [5, 8])x.train(0, [0, 0])x.predict([2.5, 4]) // 应该返回50(因为输入是前者的二分之一)x.predict([5, 8]) // 应该返回100x.predict([0, 0]) // 应该返回0

如果我的解释不够清楚,很抱歉…如果你能理解我的意思,你知道有哪些Python或PHP库可以做到这一点吗?能提供一个使用示例吗?

非常感谢你,祝你有美好的一天!


回答:

你可以使用scikit-learn来实现:

from sklearn import linear_modelclf = linear_model.LinearRegression()clf.fit([[5, 8], [0 , 0]], [100, 0])print(clf.predict([[2.5, 4], [5, 8], [0, 0]]))

你应该注意过拟合/欠拟合的风险。你可能需要考虑使用多项式特征,这将增加模型的复杂性,从而提高预测的准确性,但不要选择过于复杂的特征(在这种情况下是高次多项式),因为这肯定会导致过拟合。尝试通过交叉验证在两者之间找到一个平衡点。

还可以考虑使用RidgeLasso,它们天生就能处理过拟合问题。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注