我正在尝试使用增量PageRank算法,并采用蒙特卡洛抽样方法。我的数据包括20个不同实体之间的数百万条关系数据。
我发现Amazon DynamoDB和FlockDB是我的数据存储任务的两个不错的选择。一个简短的比较可以在这里找到。谁能指出哪一个更适合我的PageRank任务?
回答:
这个回答需要谨慎对待,因为我对你的需求不是100%确定。
首先也是最明显的,这篇论文来自Twitter(个性化PageRank – SALSA)。我知道在某个时候,他们的推荐/个性化负责人曾说过他们结合了许多其他技术使用它(这是2011年10月的信息)https://fbcdn-sphotos-b-a.akamaihd.net/hphotos-ak-snc7/300267_581958426587_2140504611_n.jpg
关于哪一个更适合你的任务,我会选择FlockDB。主要原因是它支持基于图的查询,这在你的代码中会很常见。它还有一些明确的持久化图函数,比如持久化边缘信息。