如果我使用基于相似性的算法,比如皮尔逊相关系数,来比较两个特征向量,并且我想知道在特征集中哪些维度/特征字段非常不相似,那么应该使用什么算法?我正在使用Mahout,这是一个用于Java的机器学习库。
回答:
嗯,这只是指两个向量差异最大的维度——即在该维度上向量值差异的绝对值最大的那个维度。您真的只是指这个,还是在寻找更细微的东西?
如果我使用基于相似性的算法,比如皮尔逊相关系数,来比较两个特征向量,并且我想知道在特征集中哪些维度/特征字段非常不相似,那么应该使用什么算法?我正在使用Mahout,这是一个用于Java的机器学习库。
回答:
嗯,这只是指两个向量差异最大的维度——即在该维度上向量值差异的绝对值最大的那个维度。您真的只是指这个,还是在寻找更细微的东西?