use_idf参数在tf-idf向量化中的作用是什么?文档对此没有详细说明。能有人解释一下吗?
回答:
如果use_idf
设置为True
(这是默认值),那么在转换过程中会考虑逆文档频率。这样做的结果是,在许多文档中出现的词会被自动认为不如在较少文档中出现的词那么有信息量。
如果你将其设置为False
,那么只会使用词频(文档中词的计数)。
可以查看维基百科上的这个很好的解释。
use_idf参数在tf-idf向量化中的作用是什么?文档对此没有详细说明。能有人解释一下吗?
回答:
如果use_idf
设置为True
(这是默认值),那么在转换过程中会考虑逆文档频率。这样做的结果是,在许多文档中出现的词会被自动认为不如在较少文档中出现的词那么有信息量。
如果你将其设置为False
,那么只会使用词频(文档中词的计数)。
可以查看维基百科上的这个很好的解释。