作为机器学习和tflearn/tensorflow的新手,我尝试按照tflearn的快速入门教程(泰坦尼克号的那个)进行学习。
为了适应我的需求,我修改了代码如下:
from __future__ import print_functionimport numpy as npimport tflearn# 加载CSV文件,并指明第一列表示标签from tflearn.data_utils import load_csvdata, labels = load_csv('nowcastScaled.csv', target_column=1, n_classes=2)# 数据预处理函数def preprocess(data): return np.array(data, dtype=np.float32)# 预处理数据data = preprocess(data)# 构建神经网络net = tflearn.input_data(shape=[None, 2])net = tflearn.fully_connected(net, 32)net = tflearn.fully_connected(net, 32)net = tflearn.fully_connected(net, 2, activation='softmax')net = tflearn.regression(net, optimizer='adam', learning_rate=0.001, loss='categorical_crossentropy')# 定义模型model = tflearn.DNN(net)# 开始训练(应用梯度下降算法)model.fit(data, labels, n_epoch=10, batch_size=16, show_metric=True)
但我遇到了以下错误:
ValueError: 无法为形状为(16, 1)的值提供给张量 u’InputData/X:0’,其形状为 ‘(?, 2)’
我的csv文件包含两列,一列是索引(条目编号,由于这只是测试,我限制在100条),另一列是拥堵得分(我试图预测的值,介于0到200之间),两者都是数值类型。
我大致理解我试图提供给它一个不正确的值(或者至少不是它所期待的),但我不知道如何纠正它。
回答:
添加
data = np.reshape(data, (-1, 2))
解决了我的问题,但随后我遇到了与Y相关的相同错误,于是我做了以下操作:
labels = np.reshape(labels, (-1, 2))
这两个操作都在回归之前进行的,看起来解决了问题。我不知道这是否是最好的或甚至是好的方法,但目前我已经成功消除了错误。