Scikit的LabelEncoder在`inverse_transform`中使用`numpy.int64`而不是整数

如果你用类型为int的标签fit一个sklearn.preprocessing.LabelEncoder，在inverse_transform过程中，它会返回numpy.int64类型的标签。

from sklearn.preprocessing import LabelEncoderlabels = [2,4,6] # 只是一个`int`列表e = LabelEncoder().fit(labels)encoded = e.transform([4,6,2])decoded = e.inverse_transform(encoded)type(decoded[0])# 返回 <class 'numpy.int64'>

所以我想我有两个问题

为什么会这样做？
如何在不使用自定义代码的情况下避免这种情况？

（我在使用Flask的jsonify无法将np.int64转换为JSON时遇到了这个问题）

回答：

为什么会这样做？

因为transform和inverse_transform返回的是numpy数组，并且

从数组中提取的项目，例如通过索引，将是一个Python对象，其类型与数组的数据类型相关联的标量类型相同。

在这种情况下，标量类型是int64。

如何在不使用自定义代码的情况下避免这种情况？

如果你需要获取单个元素，请使用decoded.item(0)。如果你需要整个数组，请使用decoded.tolist()。更多信息请参见将numpy数据类型转换为原生Python类型。

学技术

Scikit的LabelEncoder在`inverse_transform`中使用`numpy.int64`而不是整数

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复