我已经用逻辑回归解决了泰坦尼克号问题,现在我想用神经网络来解决这个问题。但是我的模型总是返回1,这意味着存活,对于每一个测试输入。可能我的模型存在问题。我该如何解决这个问题?
train_data = pd.read_csv('data/train.csv')test_data = pd.read_csv('data/test.csv')#一些数据清洗过程#......X_train = train_data.drop("Survived",axis=1).as_matrix()Y_train = train_data["Survived"].as_matrix().reshape((891,1))X_test = test_data.drop("PassengerId",axis=1).as_matrix()net = tflearn.input_data(shape=[None, 6])net = tflearn.fully_connected(net, 32)net = tflearn.fully_connected(net, 32)net = tflearn.fully_connected(net, 1, activation='softmax')net = tflearn.regression(net)model = tflearn.DNN(net)model.fit(X_train, Y_train, n_epoch=10, batch_size=16, show_metric=True)pred = model.predict(X_test)print pred
回答:
在输出层使用softmax作为激活层,可以确保该层所有节点输出的总和为1
。由于你只有一个节点,且输出必须总和为1
,因此它按定义总是会输出1
。
在二分类任务中,你绝不应该使用softmax作为激活函数。一个更好的选择是逻辑函数,我认为tensorflow称之为sigmoid。
所以不要使用
net = tflearn.fully_connected(net, 1, activation='softmax')
试试
net = tflearn.fully_connected(net, 1, activation='sigmoid')