我想根据人们的兴趣将他们分成不同的组。例如,喜欢机器学习和图论的人可以被分到一个组,而对数学和经济学感兴趣的人可以被分到另一个组。
该算法应该能够根据人们的兴趣决定哪些人拥有最匹配的兴趣,并创建相应的聚类。它还应该能够输出某个人所在组中的其他人的信息。
回答:
这听起来不像是一个特别困难的聚类问题,任何现成的聚类算法都可能会很好地工作。如果你知道想要多少个聚类,可以尝试使用k-means或k-medoid聚类。如果你不知道需要多少个聚类,可以尝试使用凝聚聚类方法。
问题的难点在于特征。你提到可以使用“兴趣”作为聚类的特征,但特征工程和选择总是需要一些试错过程。