使用Python读取人工智能训练数据(.csv)到特定数据结构

我是Python新手，正在尝试执行一个简单的任务，即读取一个.csv文件并将其保存到特定的数据结构中。我使用numpy来加载数据，得到的是一个ndarray的ndarray，这并不是我想要的。

我的代码如下：

import numpyfilename = '../HTRU2/HTRU_2.csv'raw_data = open(filename, 'rU')data = numpy.loadtxt(raw_data, delimiter=',')

我想要的数据结构是一个list的tuples。这些tuples是一对(x,y)的ndarray：x是一个形状为(nx – 1, 1)的ndarray，其中填充了float类型的数据，nx是文件中每行元素的数量减1；y是一个形状为(1, 1)的ndarray，它保存了该行的最后一个元素（也是float类型）。

你可能会认为这是一个我编造的奇怪数据结构，但实际上它非常有用，因为我的最终目标是将其放入神经网络中（如果你了解神经网络，你可能会猜到这个元组实际上是一对输入/输出，其中两者都是列矩阵）。我不能更改数据结构。

文件样本：

140.5625,55.68378214,-0.234571412,-0.699648398,3.199832776,19.11042633,7.975531794,74.24222492,0102.5078125,58.88243001,0.465318154,-0.515087909,1.677257525,14.86014572,10.57648674,127.3935796,0

每个元组看起来像这样：

#     x                      y[[140.5625]               [55.68378214][-0.234571412][-0.699648398][3.199832776][19.11042633][7.975531794][74.24222492]]     ,      [[0]]

回答：

我已经找到了一个解决方案：

import numpyfilename = '../HTRU2/test.csv'file = open(filename, 'rU')data = numpy.loadtxt(file, delimiter=',')training_data = list()for test in data:    training_data.append((test[:-1].reshape(8, 1), test[-1].reshape(1, 1)))

其中输入神经元的数量为8，输出神经元的数量为1。

学技术

使用Python读取人工智能训练数据(.csv)到特定数据结构

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复