我使用Gensim创建了一个Doc2Vec模型,并希望使用scikit-learn
中的DBSCAN来查找模型内句子的聚类情况。
我正在努力找出如何最好地转换模型向量以与DBSCAN一起使用并绘制聚类图,并且在网上找不到很多直接适用的例子。
这是我目前所做的:
输出: {0, 1, -1}
我认为这是两个聚类(0和1)和异常值(-1)。
我这样做对吗?
我应该如何在图表上绘制这些聚类以便可视化?
谢谢。
回答:
这里有两个问题:
-
可视化:我建议你完善DBSCAN聚类示例代码
-
如果你正在正确地进行聚类。从初步来看 – 是的。