如何为使用线性回归模型的职位推荐选择训练数据集?

我的数据库中有两种类型的档案,一种是候选人档案,另一种是由招聘人员发布的职位档案。

在这两种档案中,我有三个共同的字段,即地点、技能和经验。

我知道算法,但我在创建训练数据集时遇到了问题,我的输入特征将是从候选人档案中选择的地点、技能和薪资,但我不知道如何选择输出(相关职位档案)。

据我所知,输出只能是一个变量,那么如何在我的训练集中选择相关职位档案作为输出呢?

或者我应该选择其他方法?另一个想法是聚类。


回答:

据我理解,你想使用某种预测算法,根据候选人档案来预测职位档案。

嗯,如果你想使用回归,你需要知道一些历史数据——哪些候选人被分配了哪些职位,然后你可以基于这些历史数据创建一些模型。如果你没有这样的训练数据,你需要使用其他算法。比如,你可以将地点、技能和经验设置为三维中的特征,并使用聚类/最近邻方法来找到与职位档案最接近的候选人档案。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注