如何在文档聚类后对特定聚类进行查询搜索？

我有两个聚类作为一个类，其中包含

Cluster : classDocumentList : List<Document>centroidVector : Map<String,Double>

现在的问题是，当查询被搜索时，它被解析为一个文件，然后转换为文档对象，添加到documentIndex中，并与其他文档一起构建其索引。我这样做是因为它必须经过相同的过程，即分词、词干提取等。但现在我想在与查询向量最相似的特定聚类中实现查询搜索，即点积约为0.5到1。因此，我需要在查询向量和聚类向量之间进行点积运算来实现这一点。但我不知道如何实现，因为索引是在内存中创建的，并未存储在数据库中。仍在进行中。

谢谢

回答：

聚类不是用于搜索（即索引等）。它是一个分析步骤，旨在发现数据集中可能存在的未知结构，而不是为了更快地检索信息。你有时可以利用这种结构来加快搜索速度，但前提是你需要一个能够利用这种结构的索引。

如果你想进行相似性搜索，直接建立索引！然后通过进行一些聚类来改进索引。

学技术

如何在文档聚类后对特定聚类进行查询搜索？

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复