如何以不同的方式使用词嵌入/word2vec?用一本真正的、实体的字典

如果我的标题不正确/可以更好,请告诉我。 我一直在试图…

如何使用机器学习识别两个相似类型的词语指代相同事物?

例如,如果我有三个词“New York”、“new y…

如何在scikit的TfidfVectorizer中为专有名词增加权重

我正在使用sci-kit的TdidfVectorize…

sklearn中的层次分类

已关闭。 此问题是在寻求软件库、教程、工具、书籍或其他…

在数据中添加拼写/语法错误

基本上,我想要扩展我已经拥有的数据集,该数据集包含一系…

大规模文档近似重复检测的最新方法?

据我所知,NLP领域的科学共识是,对于大规模科学文档集…

如何禁用sklearn TfidfVectorizer的默认停用词功能

我在尝试获取日文词的tf-idf值时遇到了问题。问题在…

从文件中提取ID和相应的标记并添加到字典中,Python

我试图从一些定义了语料库(RCV1数据集标记)的文本文…

评论集合中讨论最多的m个主题

我有一组评论,每条评论讨论一个主题。我想找出这些评论中…

Tensorflow: ValueError: 无法为形状为(423,)的张量’Placeholder:0’提供值,该张量形状为'(?, 423)’

我是一个机器学习新手,正在通过这个教程学习Tensor…

Python NLP意图识别

我在Python和NLP方面是新手,我的难题是如何找出…

检测视频文件中角色说话的片段

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

无法写入核心转储,Java运行时环境检测到致命错误

当我使用Java中的Jfasttext库通过fastt…

什么是二元模型和一元模型文本特征提取的区别

我在网上搜索了如何进行二元模型和一元模型的文本特征提取…

Python – 如何使用NLP从缩写文本中直观推断单词?

我最近在处理一个使用各种单词缩写的数据库。例如, wt…

哪种深度学习模型可以对非互斥的类别进行分类

示例:我在工作描述中有这样一句:“英国的Java高级工…

文本分类。TFIDF 和朴素贝叶斯?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

如何分析电影标题?

我想使用电影上映前的可用数据(例如标题、演员、导演、制…

在MXNet中如何拼接符号

我在MXNet中有两个符号,想将它们拼接起来。如何实现…

从Keras的IMDB数据集中恢复原始文本

从Keras的IMDB数据集中恢复原始文本 我想从Ke…

卷积神经网络能够对短文本进行多少类别的分类?

我知道卷积神经网络(CNN)可以对ImageNet中的…

将同义词分类

我有50,000封电子邮件的主题行,我想根据同义词或可…

使用mstrsplit创建字符矩阵

我试图将多个评论转换成字符矩阵,以便提取其中的数字,最…

是否可以将自己的WordNet添加到库中?

我有一个丹麦语WordNet的.txt文件。是否有办法…

在这个神经网络中应该使用哪些类型的输入?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…