不带评级的推荐（Azure ML）

我正在尝试构建一个实验来创建推荐（使用电影评级样本数据库），但不使用评级。我的想法是，如果用户对某些电影进行了评级，那么他可能会对其他用户也评级过他看过的电影感兴趣。

例如，我可以认为评级为1（存在于数据库中）或0（不存在于数据库中），但在这种情况下，我应该如何转换初始数据以反映这一点呢？

我找不到任何关于这种情景的例子或教程，我真的不知道该如何进行。我应该在将数据注入算法之前转换数据吗？和/或是否有我应该使用的特定算法？

回答：

如果你希望在AML中使用Matchbox推荐器，你的想法是对的，你需要识别一些在原始数据集中不存在的用户-电影对，并将这些对添加进去，评级为零。（我假设你已经将所有真实的用户-电影对的评级设置为1，正如你上面描述的那样。）

我建议生成一些随机候选对，并在执行R（或Python）脚本模块中确认它们不在训练数据中。我不知道你的数据集特征的名称，但这里有一些R语言的伪代码来完成这个任务：

library(dplyr)df <- maml.mapInputPort(1)  # 输入数据集，包含观察到的用户-电影对all_movies <- unique(df[['movie']])all_users <- unique(df[['user']])n <- 30  # 开始时生成的随机对的数量negative_observations <- data.frame(movie = sample(all_movies, n, replace=TRUE),                                    user = sample(all_users, n, replace=TRUE),                                    rating = rep(0, n))          acceptable_negative_observations <- anti_join(unique(negative_observations), df, by=c('movie', 'user'))df <- rbind(df, acceptable_negative_observations)maml.mapOutputPort("df");

或者，你可以尝试使用关联规则学习方法，这种方法不需要你添加虚假的零评级。Martin Machac 在Cortana Intelligence Gallery中发布了一个很好的例子，展示了如何在R/AML中进行此操作。

学技术

不带评级的推荐（Azure ML）

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复