我正在为一个演示应用程序构建一个简单的推荐/建议引擎,该应用程序维护一个人的列表。对于每个人,它会跟踪他们的饮食习惯,具体偏好如下:
- 饮食类型:素食/非素食/纯素食
- 喜欢的菜系:印度菜、墨西哥菜、意大利菜等(一个人可以喜欢不止一种)
- 餐食类型及具体时间:早餐、午餐、晚餐、正餐
- 特殊饮食:生酮饮食、血型饮食、阿特金斯饮食等
- 最喜欢的蔬菜:菠菜、西兰花等
- 食物过敏要求
- 位置 – 城市、区域、街道等
一旦系统获取这些数据后,我需要构建一个简单的建议引擎 –
- 对于任何选定的人,建议10个在饮食习惯上最兼容的其他人。
- 对于选定的一组人(假设x,最多5人),建议系统中的x + 10(这里是15)人,使得所选组中每个人至少与另一人有兼容的习惯。组中人的顺序无关紧要。
我的理解是,我不需要对未知数据进行未来预测,因此实际上不需要机器学习。我所需要的只是基于现有数据集的统计兼容性进行建议。规则主要基于人们与其饮食习惯的关系。
我的理解正确吗?这个问题可以完全通过像Neo4j这样的图数据库解决吗?还是我真的需要使用Tensorflow构建一个神经模型?
回答:
确定选择哪一种的最简单方法是回答这个更具体的问题。数据是开放世界还是封闭世界。
如果你是一个原始的星际迷航粉丝,那么可以这样想:Spock需要所有的数据才能回答(封闭世界),而Captain Kirk在回答之前不需要所有信息(开放世界)。
看到你有在给出解决方案之前所需的所有数据,我会说你有一个封闭世界的问题,这应该使用Neo4j。
然而,作为逻辑编程的粉丝,我的个人偏好是使用Prolog,特别是SWI-Prolog或Mercury。