我在这个平台上看到了一些关于机器学习的问题,所以我想提出一个相关的问题:假设我有一个随机生成的食物列表,包括主菜、甜点和饮料。一个例子可能是鸡肉、芝士蛋糕和橙汁。用户会根据他们个人对这个组合的喜好,从1到5的范围内进行评分。每完成一次评分后,另一个随机的食物组合就会出现。
我的问题是,基于用户之前的所有数据,我应该使用哪种机器学习技术/算法来预测他们对随机生成的食物组合的评分?本质上,是利用他们的意见来预测他们对新食物组合的评分。有没有相关的网站/书籍可以帮助我?
回答:
你描述的是一个回归问题,因为你试图预测一个连续的数值。
对于每个数据实例,你可以提取特征并关联一个值(1-5)。特征可以是餐食中某道菜的存在(例如,has_cheesecake, has_orange_juice),每个特征都是布尔值。假设有N种可能的菜肴;那么每顿餐食就是一个数据实例(也称为特征向量),具有N个特征和一个关联的值。下面是一个N=12的例子,其中第13列是值。
0 0 0 1 1 0 0 0 1 0 0 0 51 0 0 1 0 1 0 0 0 0 0 0 30 0 0 0 0 0 1 1 0 0 0 1 4
然后你可以将这些数据输入到像Weka这样的机器学习程序中,它会为你创建一个回归模型。然后,当你想预测用户对新餐食的评分时,你可以输入一个新的向量,其中最后一列是未知的,如下所示:
0 0 1 0 0 0 1 0 0 0 0 1 ?
软件会返回一个值给你,比如3.9。