基于标签/关键词的推荐

我想知道在标签驱动的电子商务环境中使用哪种算法会更聪明：

每个商品都有多个标签。例如：

商品名称：“Metallica – Black Album CD”，标签：“metallica”, “black-album”, “rock”, “music”
每个用户都有多个标签和与他们关联的朋友（其他用户）。例如：

用户名：“testguy”，兴趣：“python”, “rock”, “metal”, “computer-science”，朋友：“testguy2”, “testguy3”

我需要通过检查用户的兴趣标签，以一种复杂的方式为这些用户生成推荐。

想法：

欢迎任何建议。也欢迎基于Python的库，因为我将使用Python语言来开发这个实验引擎。

回答：

1) 对标签进行加权。

标签可以分为几个兴趣组：

（有时你可能还需要考虑朋友的朋友的标签，但在我的经验中，这样的努力并不值得。因人而异。）

识别出个人和/或个人的朋友在兴趣中拥有的所有标签，并为这些标签附加一个权重。一个简单的标签权重公式可能是

(tag_is_in_my_list) * 2 + (friends_with_tag)/(number_of_friends)

注意这里的魔法数字2，它使得你自己的意见价值是所有朋友总和的两倍。可以随意调整 🙂

2) 对商品进行加权

对于列表中任何具有标签的商品，只需将所有加权标签值相加。数值越高，兴趣越大。

3) 应用阈值。

最简单的方法是向用户展示前n个结果。

更复杂的系统还会应用反标签（即不感兴趣的话题）并做许多其他事情，但我发现这个简单的公式既有效又快速。

学技术