很难用一句话(标题)来描述我的问题。我希望通过向用户提问来发现他们的兴趣,从而为他们分配相应的属性。
例如:通过10个问题(你喜欢科技吗?你对经济感兴趣吗?你更喜欢食物还是阅读?),我希望能够找出人们的兴趣(科技、读书、经济等),从而为他们分配如科技、文学、政治等属性。我还希望我的程序能够从用户的回答中学习这些属性。
我正在寻找一种能够帮助我分配属性的算法。对我来说,这不仅仅是一个简单的二分查找(如20问AI或类似算法),而是一种类似聚类的人工智能算法。
你对这个主题有什么建议吗?
回答:
首先,分类是监督学习,而聚类是无监督学习。你可以这样理解监督学习:
我已经有了这些已经分类的组,现在有一个新的个体/一组个体,哪个组最适合这个个体?当你训练你的模型时(例如:手动标记一封邮件为垃圾邮件),你的个体更有可能被正确分类。
在无监督学习中,相应的问题称为聚类,你有一个数据集,没有模型可以依赖,你希望了解(这最适合探索性分析)你的数据是如何根据某些指标(方差、组内个体之间的平均距离等)分组的。
你有没有尝试过使用基于关联规则的学习?