区分具有相同含义但使用不同词语组合的句子

我正在尝试学习自然语言处理,并且被一个开放式的问题困住…

修改tf-idf向量化器以加强某些关键词的权重

我在创建tf-idf矩阵以计算余弦相似度。但我想让某个…

在生物文本数据中应用机器学习

我正在尝试解决以下问题 – 给定一个包含大…

TensorFlow源代码的调用堆栈跟踪?

我一直想学习TensorFlow,因此我想阅读它的源代…

如何从OpenNLP生成器中提取特征?

我正在使用这个自定义的特征生成器: AdaptiveF…

如何在NER模型中设置空白分词器?

我正在使用CoreNLP 3.6.0创建一个自定义的N…

我对公告中的实体未被识别

我想创建一个自定义的NER模型。我做了以下工作: 训练…

从网址中提取命名实体

我正在处理一个自然语言处理问题(使用Python 2….

使用nltk计算两个句子/字符串/文本之间的句法相似度/距离 [duplicate]

这个问题已有答案: 如何计算两个文本文档之间的相似度?…

如何将RNN应用于序列到序列的NLP任务?

我对NLP任务中的序列到序列RNN感到相当困惑。之前,…

Tensorflow 如何将CSV文件中的单词(字符串)转换为适当的向量

嗨,我正在尝试在Tensorflow中制作一个小型分类…

比较名称之间的相似性

我需要基于名称对一些数据进行交叉验证。 我面临的问题是…

使用UTF-8编码的ARFF文件在Weka中无法确定结构

当我尝试在Weka中打开一个ARFF文件时遇到了问题。…

在文本分类中定义词汇量

我有一个关于在文本分类中定义用于特征提取的词汇集的问题…

如何判断机器学习分类结果更接近哪个类别

抱歉标题描述得不够清楚,我实在是找不到更好的表达方式。…

OneVsRestClassifier的损失函数

我有一个已经训练好的OneVsRestClassifi…

关于翻译引擎的信息

我对统计机器翻译很感兴趣。谁能推荐一些地方让我了解更多…

预测句子中的缺失词

如何预测句子中缺失的一个词? 我看到很多关于使用n-g…

带候选结果的翻译API

我正在寻找一种翻译API,它能够输出所有候选结果,而不…

神经网络中的投影层是什么?

已关闭。 此问题与编程或软件开发无关。目前不接受回答。…

使用scikit-learn计算成对余弦相似度

我是新手,如果有人能指导我或提供一些教程,将会非常有帮…

特征哈希

我知道特征哈希是一种将特征向量化的技术;它在机器学习中…

Python sklearn.linear_model: LinearRegression() 在.predict()时发生ValueError

我的训练矩阵X的形状为(5182, 19231),y是…

我应该使用word2vec来进行词嵌入,包括测试数据吗?

我是NLP领域的新手,正在尝试进行文本分类工作。在开始…

svm_light错误“特征必须按递增顺序排列”

来自svm_learn train.dat model…