监督潜在 Dirichlet 分配用于文档分类?

我有一组已经由人工分类的文档,分属于不同的组别。 有没…

使用监督术语加权方法与KNN算法

是否可以将监督术语加权模型与KNN分类器一起使用?我想…

精度和召回,哪个更重要?

假设我在评估一个文本分类研究项目,使用了两种方法&#8…

计算文档分类中的逆文档频率(IDF)

我在计算文档分类中的逆文档频率(IDF)时有疑问。我有…

用于文档分类的分类算法有哪些?

嘿,这是我的问题, 我有一组文档,需要将每个文档分配到…

文档特征向量表示

我正在构建一个文档分类器来对文档进行分类。 因此,第一…

在MATLAB中对单元数组进行分类

我想对一组新闻数据集进行文本分类。我有很多特征,比如s…

机器学习中,实例数量与实例内容哪个更重要?

在文档分类领域,如果我有一个包含1000个实例的数据集…

使用Weka进行文本分类

我在Java中使用Weka库构建一个文本分类器。 首先…

在Weka中创建测试集

假设我有一个以如下形式编写的ARFF文件: @rela…

使用朴素贝叶斯进行文本分类

我正在使用朴素贝叶斯进行文本分类的机器学习问题。我将每…

在 Python 中抑制 libsvm 的输出

我在 Python 中使用 libsvm(svmuti…

使用标签对文档进行分类

我有大量的文档(主要是PDF和DOC格式),我想对它们…

从网页分类网站类型

是否有可靠的或已部署的方法、算法或工具,通过解析其部分…

如何将词语作为分类中的数值特征

在任何机器学习算法中,使用词语本身作为特征的最佳方法是…

LibSVM与非数值数据

我想使用LibSVM进行文本分类。你建议我如何将词语转…

用于校正倾斜文档的算法

我正在进行一个涉及光学字符识别(OCR)的项目。在检测…

使用不完整训练集进行文档分类

请提供建议。我有一组文档,这些文档都有一个共同的属性(…