> df1 = data.frame(v1=c('a','a','c','x','y','z'),v2=c('b','c','a','y','z','y'),v3=c('c','b','b','z','x','x')) v1 v2 v31 a b c2 a c b3 c a b4 x y z5 y z x6 z y x
期望的输出:
v1 v2 v3 a b c x y z
或者(顺序不重要)
v1 v2 v3 c a b z y x
我正在尝试在一个数据框中查找行的唯一组合。
我尝试过
unique(df[,c('v1','v2','v3'))
但是,我没有得到期望的输出。我的数据框包含多个组合,并且还包括NA。请帮助我。
回答:
以下方法适用于你的数据示例,我相信它也适用于更大的数据集。
inx <- !duplicated(apply(df1, 1, function(x) paste(sort(x), collapse = "")))df1[inx, ] v1 v2 v31 a b c4 x y z