tf-idf – 学技术

IT技术

如何使用不同特征作为输入的两个模型进行集成学习？

xiaolong · 2025年6月1日 · 0 Comment

我有一个假新闻检测问题，通过向量化’twe…

IT技术

NLP工作流程

xiaolong · 2025年6月1日 · 0 Comment

在NLP中，我应该在train_test_split之…

IT技术

如何使用FeatureUnion构建参数网格？

xiaolong · 2025年5月31日 · 0 Comment

我正在尝试运行一个结合了文本和数值特征的模型，但遇到了…

IT技术

在TF-IDF变换后测试集和训练集特征数量不同导致的错误

xiaolong · 2025年5月31日 · 0 Comment

我正在尝试创建一个AI，它可以读取我的数据集，并判断输…

IT技术

AttributeError: dense not found

xiaolong · 2025年5月30日 · 0 Comment

任务：使用CountVectorizer和TfidfT…

IT技术

如何将tf-idf应用于文本行

xiaolong · 2025年5月29日 · 0 Comment

我有一行行的简介（以文本格式存在），我想使用tf-id…

IT技术

如何为tf-idf向量化器创建scikit流水线？

xiaolong · 2025年5月29日 · 0 Comment

我在阅读这个官方的sklearn 教程，了解如何为文本…

IT技术

TF-IDF向量可以在不同级别的输入标记（词语、字符、n-gram）上生成，我们应该使用哪一种？

xiaolong · 2025年5月28日 · 0 Comment

a. 词级TF-IDF：矩阵表示不同文档中每个词项的t…

IT技术

使用TFIDF作为输入的LSTM，维度错误

xiaolong · 2025年5月28日 · 0 Comment

我在尝试使用TFIDF作为输入运行LSTM时遇到了错误…

IT技术

使用TF-IDF和非TF-IDF特征的准确性

xiaolong · 2025年5月28日 · 0 Comment

我使用TF-IDF和非TF-IDF特征运行了一个随机森…

IT技术

如何在Tensorflow Transform中计算TF-IDF（使用tft.tfidf函数）

xiaolong · 2025年5月28日 · 0 Comment

在浏览Tensorflow Transform的文档时…

IT技术

GridSearchCV + StratifiedKfold 在 TFIDF 情况下的应用

xiaolong · 2025年5月28日 · 0 Comment

我正在处理一个分类问题，需要预测文本数据的类别。我需要…

IT技术

如何实现与sklearn的TfidfVectorizer相同的结果？

xiaolong · 2025年5月27日 · 0 Comment

我正在尝试从头开始构建TfidfVectorizer，…

IT技术

ValueError: 检查目标时出错：期望dense_22的形状为(100, 50)，但得到的数组形状为(1, 50)

xiaolong · 2025年5月27日 · 0 Comment

我正在训练一个神经网络来预测一组文档的文档频率。主要…

IT技术

如何将K折交叉验证应用于TfidfVectorizer？

xiaolong · 2025年5月26日 · 0 Comment

我在应用K折交叉验证时遇到了问题，使用Tfidf时出现…

IT技术

从头实现TF-IDF向量化器

xiaolong · 2025年5月25日 · 0 Comment

我在尝试用Python从头开始实现一个tf-idf向量…

IT技术

如何在收集的数据上使用TF-IDF进行文本分类？

xiaolong · 2025年5月25日 · 0 Comment

我正在进行一个个人项目，旨在构建一个文本分类器。我从8…

IT技术

如何查看每个词的tf-idf得分

xiaolong · 2025年5月24日 · 0 Comment

我试图了解文档中每个词的tf-idf得分。然而，它只返…

IT技术

NLP – 如何添加更多特征？

xiaolong · 2025年5月24日 · 0 Comment

我想使用 sklearn 分类器训练一个模型来对数据条…

IT技术

在tf-idf中，文档和语料库是什么？

xiaolong · 2025年5月24日 · 0 Comment

tf-idf = 词频 * 逆文档频率词频被定义为一…

IT技术

AttributeError: ‘int’ object has no attribute ‘lower’ 在 TFIDF 和 CountVectorizer 中

xiaolong · 2025年5月22日 · 0 Comment

我尝试预测入口消息的不同类别，并在波斯语上进行了工作。…

IT技术

重用带有tf-idf特征选择的sklearn文本分类模型

xiaolong · 2025年5月22日 · 0 Comment

我对sk-learn和机器学习还比较新手，所以请原谅我…

IT技术

TfidfVectorizer对大型数据集的拟合输出是否隐式设定了阈值？

xiaolong · 2025年5月1日 · 0 Comment

我正在尝试使用sklearn中的TfidfVector…

IT技术

Sklearn中CountVectorizer在管道中的NotFittedError

xiaolong · 2025年5月1日 · 0 Comment

我正在尝试通过sklearn学习如何处理文本数据，但遇…

IT技术

scikit的cross_val_predict是否为每个折叠重新计算tfidf？

xiaolong · 2025年5月1日 · 0 Comment

我训练了一个分类器，如下所示： text_clf = …