我正在做一个名为“从社交网络数据中发现关联规则:将数据挖掘引入语义Web”的项目。 谁能推荐一个好的算法来源(以及它的代码。我听说可以用Perl和R包来实现),以便从社交网络数据库中找到关联规则?
可以在以下链接中获取数据库的快照: https://docs.google.com/uc?id=0B0mXGRdRowo1MDZlY2Q0NDYtYjlhMi00MmNjLWFiMWEtOGQ0MjA3NjUyZTE5&export=download&hl=en_US
该数据集可在以下链接中找到: http://ebiquity.umbc.edu/get/a/resource/82.zip
我为此项目搜索了很多,但不幸的是,到目前为止还没有找到有用的东西。 我发现以下链接在某种程度上相关:
犯罪数据: http://www.computer.org/portal/web/csdl/doi/10.1109/CSE.2009.435
非常感谢您的帮助。
谢谢,
回答:
这比 http://en.wikipedia.org/wiki/Association_rule_learning 范围更广一些,但希望对您有所帮助。
一些早期可能有趣的FOAF工作(SVD / PCA等):
http://stderr.org/~elw/foaf/ http://www.scribd.com/doc/353326/The-Social-Semantics-of-LiveJournal-FOAF-Structure-and-Change-from-2004-to-2005 http://datamining.sztaki.hu/files/snakdd.pdf
此外,http://www.amazon.com/Understanding-Complex-Datasets-Decompositions-Knowledge/dp/1584888326 的第4章专门讨论了矩阵分解技术在图形数据结构中的应用;强烈推荐。
最后,Apache Mahout 是大规模数据挖掘、机器学习等的自然选择, https://cwiki.apache.org/MAHOUT/dimensional-reduction.html