SpaCy的相似度是如何计算的?

这里有一个初学者的NLP问题: .similarity…

嵌入层的初始值是什么?

我正在研究词表示的嵌入。在许多深度神经网络库中,它们都…

如何使用斯坦福NLP查找单词的将来时

我最终的目标是确定一个句子的时态是否为将来时。我的策略…

如何在ScikitLearn中查看特征在任何模型中的相关性?

我正在使用scikit-learn中的逻辑回归和线性S…

两个文档中单词对之间的词移动距离计算

根据论文中的WMD描述,单词对之间的旅行成本或欧几里得…

mteval-v13a.pl和NLTK BLEU有什么区别?

Python NLTK中有BLEU分数的实现,nltk…

NLP解析包含在一个查询中的多个问题

如果用户的一个查询包含属于不同类别的多个问题,如何识别…

NLP – 在预处理过程中何时将文本转换为小写

我想构建一个语言模型,用于预测句子中下一个词,根据前面…

如何使用已训练的模型创建新模型?

我使用gensim的word2vec创建了两个模型。现…

使用所有可能的3-gram向量化三元组 – Python

我正在尝试创建一个3-gram模型以应用机器学习技术。…

Tensorflow seq2seq中的TrainingHelper不使用开始标记作为初始输入?

根据我的理解,seq2seq模型解码器的第一个输入应该…

Keras文本预处理 – 将Tokenizer对象保存到文件以进行评分

我通过以下步骤(概括)使用Keras库训练了一个情感分…

如何将损失函数中的变量存储到实例变量中

我正在使用Keras和Tensorflow。由于我想创…

分割连写姓名的一种算法

我的问题是 我有一些全名是连写的,比如“davidro…

Java中虚拟助手的查询分类?

这是我第一次在Stack Overflow上发帖,请告…

NLP 通用英语到动作

我正在使用基于文本的自然语言处理来自动化应用程序的任务…

从电子邮件中提取字段,使用数据库中的值作为训练集

我有480封电子邮件,每封邮件包含以下一个或所有值: …

将文本分类到多个类别中

已关闭。此问题需要详细信息或澄清。目前不接受回答。 想…

使用sklearn获取词语的tf-idf权重

我有一组维基百科的文本。 使用tf-idf,我可以定义…

使用HashingVectorizer后Sklearn的输入形状错误

我有204567个单词,其中21010个是唯一的。每个…

AttributeError: ‘NoneType’ object has no attribute ‘items’ for classifier = nltk.NaiveBayesClassifier.train(training_set)

我在运行代码时遇到了这个错误:AttributeErr…

余弦相似度与余弦距离

我有一组文档,如下面的示例所示。 doc1 = {‘S…

训练文本模型以预测真假

我对机器学习这个领域还比较陌生,但我认为我有一个有趣的…

Scikit-Learn – 没有真正阳性 – 数据标准化的最佳方法

感谢您抽时间阅读我的问题! 我正在进行一个实验,试图通…

如何将API.AI机器人连接到MySQL数据库

已关闭。此问题需要更加集中。目前不接受回答。 想要改进…