我计划运行一个机器学习算法,该算法学习节点值和边权重。该算法与这里的值迭代算法非常相似。每个节点代表一个位置,每条边是一条通往新位置的路径。每个节点和边都保持一个值,表示其吸引力。这些值在每次迭代中根据前一次迭代的值进行更新。
我计划使用neo4j作为后端。目前将有大约600,000个节点和100,000,000条边,但以后可能会增加更多(图无法装入内存)。保留前一次迭代的值的最佳方法是什么?我想到的两种方法是:
- 克隆当前数据库,使用一个副本作为“当前迭代”副本,另一个副本作为“前一次迭代”副本。
- 在每次迭代结束时,将每个节点和边的所有值移动到“前一次迭代”属性中。
人们通常是如何做的?有没有更好的方法?
回答:
图的大小是多少,你要进行多少次迭代?对于较小的图,我会复制图的版本,要么作为新图存储在磁盘上,要么在同一个数据库中作为子图。
对于更大的数据量,我认为属性归档方法更好。