Home IT技术如何从稀疏矩阵中筛选出非零重要性的特征？

如何从稀疏矩阵中筛选出非零重要性的特征？

IT技术 xiaolong · 2025年5月29日 · 0 Comment

我有一个数据集，其中大部分列包含文本值。因此，我使用了tfidf和计数向量化器将这个数据集转换为向量形式。结果，我得到了一个稀疏矩阵。我应用了决策树算法，并且得到了预期的结果。现在，我想要准备另一个模型，仅使用那些具有非零特征重要性的特征。但是，我无法筛选出那些具有非零重要性的特征。

X_tr<65548x3101 sparse matrix of type '<class 'numpy.float64'>'    with 7713590 stored elements in Compressed Sparse Row format>

这里，X_tr 是我的训练数据集。

X_tr.shape(65548, 3101)dtc.feature_importances_.shape(3101,)

这里，’dtc’ 是我的决策树分类器模型。

我的问题是，如何获得另一个仅包含特征重要性为非零值的特征的稀疏矩阵？

回答：

我认为这应该像这样简单：

X_tr[:, dtc.feature_importances_ != 0]

decision-tree geopandas machine-learning numpy python

发表回复取消回复