使用朴素贝叶斯分类识别Twitter用户性别

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

如何将R语言文本挖掘中获得的术语文档矩阵转换为Excel或CSV文件?

更具体地说,假设我有一个名为”names&…

如何在新(测试)数据上重新创建相同的文档术语矩阵

假设我有基于文本的训练数据和测试数据。更具体地说,我有…

是否有基于Java的开源框架可以根据带分隔符的关键字符串从文本字段中查找值?

是否有基于Java的开源框架可以根据带分隔符的关键字符…

Weka ARFF生成

我正在尝试从一个CSV数据文件生成一个.arff文件。…

Mallet是否有图形用户界面?

有人见过Mallet的图形用户界面吗? 谢谢 回答: …

为什么在R中加载模型需要那么多时间?

为了一个个人项目,我需要对不同的文本运行多种机器学习算…

文档聚类的对数似然相似度

我使用以下对数似然公式来比较文档与聚类之间的相似性:l…

如何判断两个网页内容是否相似?

给定两个HTML源代码,我首先想使用像这个工具来提取其…

使用Rattle加载WEKA的字符串到向量文件

我一直在使用WEKA进行文本分类工作,现在我想尝试使用…

RapidMiner 情感分析

我有一组被分类为正面或负面的短消息,这些消息保存在一个…

WEKA – 在Java中对新数据进行分类 – IDF变换

我们正在尝试在Java程序中实现一个WEKA分类器。到…

潜在 Dirichlet 分配与文档聚类的关系

我想澄清潜在 Dirichlet 分配(LDA)与文档…

Mallet: 每个预测的特征贡献

我正在使用CRFs在Mallet上开发一个NER系统。…

大规模机器学习

目前来看,这个问题不适合我们的问答格式。我们期望答案能…

如何在搜索引擎中实现同义词功能?

我正在开发一个宠物搜索引擎(SE)。 目前我有一个基于…

适用于Android的机器学习库

已关闭。 此问题是在寻求对软件库、教程、工具、书籍或其…

如何在不同语言的文本中检测年龄的特征?

我有一个涉及多种语言的文本分类任务。我希望创建一个从文…