对于推荐用户物品的任务,我可以将数据集分为训练集和测试集,并通过平均绝对误差来评估结果。然而,当我需要查找某物品的相似物品时,我不知道如何评估这些结果。例如,
输入:
userid,itemid,score 1, 123, 5 2, 222, 1 ....
svd.similar(123)
输出可能是:(222,0.98),(121,0.78)…我不知道通过SVD找到的相似物品是否准确,如何评估这些结果呢?
回答:
你可能需要先定义一个相似度函数(距离函数),例如余弦距离或欧几里得距离。然后就可以确定并比较相似度了。