关键词关联学习算法

为了描述我的问题，我将使用一个约会网站作为例子（尽管这并不是实际情况）。我的问题是，我有一组用户可以输入他们喜欢的关键词，比如“高个子，黑头发，蓝眼睛”等，我希望将这些关键词映射到符合这些标准的其他用户身上。更进一步，我需要能够从反馈的数据中学习，以做出更好的预测，即使这些预测并不是完全精确的匹配。

例如，如果其他寻找“黑头发”的人喜欢“黑色头发”的用户，或者身高6英尺4英寸但没有提到他们是高个子。我希望能够在这些相似的关键词之间建立关联，并且也能够建议这些关键词，以便最佳地返回用户想要的结果，即使这并不是他们所要求的完全匹配。

我的问题是，哪种算法/方法最适合这种情况？我一直在研究以下领域：

决策树，但当没有关键词匹配时，它们似乎会失效。
朴素贝叶斯，这似乎对缺失的连接更宽容，但需要对连接有一些先验知识，由于关键词可以是任何东西，这似乎是一个障碍。
人工神经网络（ANN），但这些似乎不适合处理文本输入。
KNN，但我不知道如何处理可能无限的用户分类？
某种A*地图搜索，每当用户1喜欢用户2时，我就在用户1的喜好和用户2的特征之间建立地图连接，如果该连接已经存在，我就缩短它，然后找到最接近的N个用户。我只是不确定这种方法的可扩展性如何。

任何建议都将不胜感激，谢谢！

回答：

这听起来像是关联规则学习的经典应用：基本上，如果寻找“黑头发”伴侣的人喜欢很多“黑色头发”的账户，那么你就有了这两个之间的关联规则。有算法可以检测到这一点。

关于你的建议，你试过人工神经网络（ANN）吗？ANN完全不适合处理文本输入，但对于大多数机器学习+文本任务，你可以将文本转换为数值数据（例如，查看词袋模型）。一旦你有了数值特征，它们应该表现得还不错。

例如，你希望你的网络根据个人资料设置返回合适的推荐，对吗？你会向它输入个人资料设置，如果你有训练数据显示寻找“黑头发”的人喜欢“黑色头发”的用户，ANN应该能学会这种关系。

不过，关联规则听起来是可行的方法。

学技术

关键词关联学习算法

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复