我对编程非常新手。最近我开始尝试使用 Python 中的 numpy。我有一个 csv 文件,我已经将其赋值给了一个变量。我已经检查了这个变量的形状,并且还查看数据集中值的数据类型。但是我的文档中提到了我所问的问题中的条目,它试图将 data.dtypes 与 np.object 进行比较。我不太理解这意味着什么。但当我在 Python 控制台上执行它时,我得到了以下输出。
column1 Falsecolumn2 Falsecolumn3 Falsecolumn4 True…..
如果有人能解释一下,我将不胜感激。
回答:
np.object
– 是一种用于字符串和单元格中非标量值的数据类型。
演示:
CSV 文件:
col1,col2,col31,2,34,XXX,6data = pd.read_csv(filename)
结果:
In [84]: dataOut[84]: col1 col2 col30 1 2 31 4 XXX 6In [85]: data.dtypesOut[85]:col1 int64col2 objectcol3 int64dtype: objectIn [86]: data.dtypes == np.objectOut[86]:col1 Falsecol2 Truecol3 Falsedtype: bool
现在让我们添加一个包含非标量值(列表)的列:
In [87]: data['col4'] = [[1,2], [3,4,5]]In [88]: dataOut[88]: col1 col2 col3 col40 1 2 3 [1, 2]1 4 XXX 6 [3, 4, 5]In [89]: data.dtypesOut[89]:col1 int64col2 objectcol3 int64col4 objectdtype: objectIn [90]: data.dtypes == np.objectOut[90]:col1 Falsecol2 Truecol3 Falsecol4 Truedtype: bool