将句子分类到多个类别中

我是NLTK和Scikit-learn的新手。我希望能…

为训练准备数据

我正在尝试通过创建字符文本的一热编码来准备数据文件,以…

使用Scikit-learn计算信息增益

我在使用Scikit-learn进行文本分类。我想计算…

使用SGDClassifier的partial_fit方法进行增量/在线学习

我已经构建了一个增量学习模型,但不确定它是否正确。我有…

scikit-learn中的CountVectorizer和CharNGramAnalyzer有什么区别?

我对CountVectorizer和CharNGram…

发现数组维度为3。估计器期望维度 <= 2

我在使用LDA处理一组简单的文档集合。我的目标是从中提…

文本挖掘中的特征数量

我正在尝试基于文本挖掘建立一个预测模型。我对模型中应该…

如何向客户解释分类器为何做出这样的决策?

已关闭。此问题属于基于意见的问题。目前不接受回答。 想…

机器学习 – 仅有正面文本数据集

我有一个包含数千条与某个主题相关的句子的数据集。我想知…

AttributeError: ‘NoneType’ object has no attribute ‘items’ for classifier = nltk.NaiveBayesClassifier.train(training_set)

我在运行代码时遇到了这个错误:AttributeErr…

使用机器学习对公司名称进行行业分类

已关闭。 此问题需要调试细节。目前不接受回答。 编辑问…

识别负面数据集中积极性和消极性

首先,我想让大家知道,我对机器学习(ML)还是一个新手…

评论集合中讨论最多的m个主题

我有一组评论,每条评论讨论一个主题。我想找出这些评论中…

使用Google搜索术语列表以构建特定类别的词袋

我很难理解构建词袋的过程。这将是一个多类别分类监督机器…

如何使用scikit-learn对文本对进行分类?

我阅读了许多关于这个主题的不同博客,但始终没有找到一个…

如何通过保存训练模型使用pickle来减少编译时间?

这是一段情感分析代码,每次我更改输入时,编译需要10到…

通过Twitter预测用户个性的文本分类准确率低

我正在进行一个项目,利用用户的推文来预测其个性。 在训…

卷积神经网络能够对短文本进行多少类别的分类?

我知道卷积神经网络(CNN)可以对ImageNet中的…

如何将文档分割成训练集和测试集?

我正在尝试构建一个分类模型。我在本地文件夹中有1000…

最佳机器学习方法自动化文本/模糊匹配

我对机器学习还比较新手,已经用Python完成了几个项…

使用实值特征的斯坦福分类器

我想使用斯坦福分类器进行文本分类。我的特征主要是文本性…

多项式朴素贝叶斯 – 理论与实践

好的,我正在学习Andrew Ng的机器学习课程。目前…

使用SciKitLearn的RandomForestClassification对分类数据进行预测

我使用SkLearn创建了一个RandomForest…

如何使用词袋模型或TF-IDF对文本进行分类

我有一个关于使用词袋模型或类似方法进行分类的普遍问题。…

非朴素的文本分类算法?

朴素贝叶斯算法假设特征之间是独立的。哪些文本分类算法不…