text-classification – 第 6 页

IT技术

我不知道如何解释使用Scikit Learn进行分类的准确性

xiaolong · 2025年4月7日 · 0 Comment

我正在尝试使用Scikit Learn对文本数据进行分…

IT技术

如何使用sklearn库进行朴素贝叶斯文本分类？

xiaolong · 2025年4月7日 · 0 Comment

我正在尝试使用朴素贝叶斯文本分类器进行文本分类。我的数…

IT技术

使用机器学习进行作者归属分析

xiaolong · 2025年4月7日 · 0 Comment

已关闭。此问题需要更加聚焦。目前不接受回答。想要改进…

IT技术

如何使用词性标记序列作为特征训练朴素贝叶斯分类器？

xiaolong · 2025年4月7日 · 0 Comment

我有两类句子，每类都有相当独特的词性标记序列。我如何使…

IT技术

CountVectorizer 删除仅出现一次的特征

xiaolong · 2025年4月7日 · 0 Comment

我在使用 sklearn 的 Python 包时，遇到…

IT技术

如何对URL进行分类？URL的特征是什么？如何从URL中选择和提取特征？

xiaolong · 2025年4月7日 · 0 Comment

我刚刚开始处理一个分类问题。这是一个二分类问题，我的训…

IT技术

朴素贝叶斯分类中的未知词

xiaolong · 2025年4月7日 · 0 Comment

如何测试包含未知词的文本分类问题？在训练模型时，我们可…

IT技术

如何使用Pattern对西班牙语单词进行词形还原？

xiaolong · 2025年4月7日 · 0 Comment

我想对一组评论进行词形还原。据我所知，nltk无法对英…

IT技术

Machine-Learning – 概念 / 推荐

xiaolong · 2025年4月7日 · 0 Comment

大家好，我是机器学习的新手，目前正在寻找一个文本分类解…

IT技术

Naive Bayes: 不平衡测试数据集

xiaolong · 2025年4月7日 · 0 Comment

我使用scikit-learn的多项式朴素贝叶斯分类器…

IT技术

错误分类到多个类别中不同比例的类别

xiaolong · 2025年4月7日 · 0 Comment

我遇到了以下问题：我试图对大量文本文档进行分类。共有…

IT技术

如何在SVM中编码不同大小的特征向量

xiaolong · 2025年4月7日 · 0 Comment

我在对包含多句话的评论（段落）进行分类。我使用Weka…

IT技术

使用R进行层次预测

xiaolong · 2025年4月7日 · 0 Comment

已关闭。此问题不符合 Stack Overflow …

IT技术

如何从Weka文本分类中输出结果文档

xiaolong · 2025年4月7日 · 0 Comment

我们正在对15000条推文进行多项式朴素贝叶斯分类。我…

IT技术

使用LibShortText处理LibSVM格式的文件

xiaolong · 2025年4月7日 · 0 Comment

我在尝试使用LibShortText，但我并不完全理解…

IT技术

处理来自不同文档的相同词

xiaolong · 2025年4月7日 · 0 Comment

我正在编写一个Python类，用于计算文档中每个词的t…

IT技术

如何在Rapid Miner中将”Process Documents From Files”操作的输出提供给多个分类器？

xiaolong · 2025年4月7日 · 0 Comment

我正在进行并行分类器组合的研究，并且在Rapid Mi…

IT技术

如何在Rapidminer中对独立测试集应用信息增益？

xiaolong · 2025年4月7日 · 0 Comment

我在Rapidminer中处理文本分类。我有独立的测试…

IT技术

如何将RapidMiner的示例集转换为Weka的实例？

xiaolong · 2025年4月7日 · 0 Comment

我需要使用Weka的某些功能，同时也需要使用Rapid…

IT技术

如何估算特征的总数？

xiaolong · 2025年4月7日 · 0 Comment

如果我有1000个词元（我假设词元在预处理数据集后就是…

IT技术

为什么KNN的准确率低但精确率高？

xiaolong · 2025年4月7日 · 0 Comment

我使用k-nn对20NG数据集进行了分类，每个类别有2…

IT技术

如何从数据集中修剪低频和高频词？

xiaolong · 2025年4月7日 · 0 Comment

有没有什么工具可以让我从数据集中修剪掉高频和低频词？ …

IT技术

训练文档数量对分类时间的影响？

xiaolong · 2025年4月7日 · 0 Comment

训练文档的数量是否会影响分类时间？我知道在K-最近邻（…

IT技术

如何在Weka中应用特征降维方法？

xiaolong · 2025年4月7日 · 0 Comment

如何在Weka中应用LSI等特征降维方法进行文本分类？…

IT技术

文本分类 – 如何找出最影响决策的特征

xiaolong · 2025年4月7日 · 0 Comment

在使用SVMlight或LIBSVM进行情感分析，将短…