我需要为一个项目设计一个推荐算法,该项目有以下参数:
- 用户的个人资料,包含用户的简短描述以及用户的兴趣
- 从review.com获取的产品描述,包含产品的规格
没有任何用户的评分或愿望清单,我只有这些数据,需要找出产品对用户的适用性。
回答:
你的问题非常模糊,但如果你只有描述用户的一系列词语和描述产品的一系列词语,那么我能想到的只是一个简单的相似度度量方法:
- 余弦相似度(又称内积)
- 骰子相似度
- 雅卡尔相似度等
这似乎并不是一个好的项目,除非我遗漏了什么。如果你没有大量数据,无论你的算法/模型等有多好都没有用。如果这就是全部,看起来你被要求编写一个高级的字符串相似度函数。
在信息检索中,可以使用tf-idf(词频-逆文档频率)来获得更高质量的效果,但看起来你没有什么可以利用的…希望这对你有帮助。祝你好运!