为文档加载预训练的word2vec模型

我在使用gensim从文档中提取特征向量。我已经从Go…

使用Python中的Keras进行序列分类

我正在尝试使用Python 3中的Keras进行序列分…

处理测试数据集中新术语的策略

我正在使用word2vec模型在训练数据集上构建分类器…

在Keras中实现时间上的最大池化

我在使用Keras中的CNN进行一个NLP任务,我尝试…

如何在arff文件中表示n-gram特征?

我在网上搜索这个问题但一直没有找到解决方案。问题是:我…

在NLTK中基于标记器的分块器的新句子分块

我正在尝试在NLTK中实现一个基于标记器的分块器。我编…

根据内容对客户问题进行分类

我正在开发一个用户可以提问的Web应用程序。这些问题应…

如何为未知词获取随机的word2vec向量?

我在训练数据上训练了word2vec,但测试数据中有一…

如何根据上下文对相似类型的句子进行聚类并从中提取关键词

我想根据句子的上下文对其进行聚类,并从相似上下文的句子…

MS Luis.ai | 每个意图/应用程序的最大话语数量

关于我在他们GitHub页面上的提问: https:/…

如何使用词袋模型或TF-IDF对文本进行分类

我有一个关于使用词袋模型或类似方法进行分类的普遍问题。…

为什么朴素贝叶斯在Spark MLlib Pipeline中不像逻辑回归那样工作?

我正在使用Spark和Scala进行推文的情感分析工作…

如何在Weka中使用字符串数据进行SVM(SMO)分类

我有一个包含一些句子(波斯语)的arff文件,每个句子…

从gensim word2Vec获取权重矩阵

我在Python中使用gensim的word2vec包…

StanfordCoreNLP对象创建错误

我遇到了这个问题: Exception in thre…

如何为词义消歧准备Weka数据

我想使用Weka进行词义消歧。我准备了一些文件,每个文…

多分类任务中F-measure的宏平均和微平均

我有50个文件,每个文件包含一个多义词(即拼写相同但含…

使用Python进行序列到序列建模

我正在尝试制作一个使用序列到序列模型来回应用户输入的聊…

NLTK: 语料库级别BLEU分数与句子级别BLEU分数

我在Ubuntu上使用Python导入了nltk来计算…

使用NLP查询结构化数据有意义吗?

我知道这个问题可能不适合在SO上提问,但请暂时让这个问…

文本挖掘和机器学习

已关闭。 此问题正在寻求关于软件库、教程、工具、书籍或…

产品价格比较工具:匹配相同商品的难题

我正在开发一个电商产品价格比较工具(使用Python)…

如何为sklearn的CountVectorizer设置自定义停用词?

我正在尝试对非英语文本数据集运行LDA(潜在Diric…

在spacy中独立进行词形还原是否可行?

我正在使用spacy对情感分析的数据进行预处理。 我想…

自动解决客户技术问题生产L3工单

我想开发一款应用程序/软件,能够理解各种输入的文本,并…