我有以下示例数据
Timestamp,Col1,Col2,Col3,Col4,Col52/11/2016 22:59:24,1,1,1,0,02/12/2016 14:43:01,0,0,0,0,02/12/2016 15:19:37,1,1,1,1,02/13/2016 17:33:38,1,1,1,0,12/14/2016 15:59:31,1,1,1,1,0
我已经将这些数据导入到R中的数据对象中。
我想使用arules
库来分析这些数据。
但到目前为止,我只能执行以下代码:
require(arules)data(package="arules")data(Groceries)Groceriessummary(Groceries)itemFrequencyPlot(Groceries,topN=20,type="absolute")rules <- apriori(Groceries, parameter = list(supp = 0.0001, conf = 0.8))
我不明白为什么这些函数在我自己的数据对象上不起作用。
我的问题
能否有人解释一下如何让这些函数在我的CSV数据上工作?我认为这只是一个正确格式化数据的问题,需要使用正确的函数,但我不知道具体该怎么做。
回答:
你可以这样做
MyData <- read.csv(text="Timestamp,Col1,Col2,Col3,Col4,Col52/11/2016 22:59:24,1,1,1,0,02/12/2016 14:43:01,0,0,0,0,02/12/2016 15:19:37,1,1,1,1,02/13/2016 17:33:38,1,1,1,0,12/14/2016 15:59:31,1,1,1,1,0")require(arules)trans <- as(MyData[,-1]>0, "transactions") rules <- apriori(trans, parameter = list(supp = 0.0001, conf = 0.8))