Milvus : 如何存储“id 到数据”的关系?

这个问题与这个问题相关。

我使用milvus来研究大约一百万张图像的数据集中的图像相似性。

当我插入一张图像时,Milvus会返回一个id,这个id是该图像在milvus数据库(mysql)中的id。当Milvus进行研究时,它会返回最相似图像的id。

现在我需要跟踪“id -> 图像名称”的关系,以便在研究完成后能够展示正确的图像。

在提供的示例中,通常是将这种关系存储在本地字典中(或使用像diskcache这样的包)。

当训练和研究在同一台机器上进行时,这种方法运作良好。

我想在一台机器上进行训练,而在另一台机器上进行推理。

我的第一个想法是将“id->名称”关系存储在与milvus其余部分相同的mysql中的一个单独表中。

这是个好主意吗?这将在研究后增加一个mysql请求。

我可以对milvus的“id->向量”表和我的“名称->id”表进行mysql连接吗?这样milvus就可以在返回图像id的同时返回我的图像名称?


回答:

将“id->名称”关系存储在mysql上是个好主意。

但我不建议使用mysql来存储“id->向量”关系,因为向量数据通常较大,占用更多空间。

顺便提一下,使用像diskcache这样的包来存储“id->名称”关系也是一个不错的选择。因为它非常方便。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注