使用tflearn神经网络解决Kaggle泰坦尼克号问题

我已经用逻辑回归解决了泰坦尼克号问题，现在我想用神经网络来解决这个问题。但是我的模型总是返回1，这意味着存活，对于每一个测试输入。可能我的模型存在问题。我该如何解决这个问题？

train_data = pd.read_csv('data/train.csv')test_data = pd.read_csv('data/test.csv')#一些数据清洗过程#......X_train = train_data.drop("Survived",axis=1).as_matrix()Y_train = train_data["Survived"].as_matrix().reshape((891,1))X_test  = test_data.drop("PassengerId",axis=1).as_matrix()net = tflearn.input_data(shape=[None, 6])net = tflearn.fully_connected(net, 32)net = tflearn.fully_connected(net, 32)net = tflearn.fully_connected(net, 1, activation='softmax')net = tflearn.regression(net)model = tflearn.DNN(net)model.fit(X_train, Y_train, n_epoch=10, batch_size=16, show_metric=True)pred = model.predict(X_test)print pred

回答：

在输出层使用softmax作为激活层，可以确保该层所有节点输出的总和为1。由于你只有一个节点，且输出必须总和为1，因此它按定义总是会输出1。

在二分类任务中，你绝不应该使用softmax作为激活函数。一个更好的选择是逻辑函数，我认为tensorflow称之为sigmoid。

所以不要使用

net = tflearn.fully_connected(net, 1, activation='softmax')

试试

net = tflearn.fully_connected(net, 1, activation='sigmoid')

学技术

使用tflearn神经网络解决Kaggle泰坦尼克号问题

发表回复取消回复

相关文章：

Related Posts

Keras Dense层输入未被展平

无法将分类变量输入随机森林

如何在Keras中对每个输出应用Sigmoid函数？

如何选择类概率的最佳阈值？

在Keras中使用深度学习得到不同的结果

‘MatMul’操作的输入’b’类型为float32，与参数’a’的类型float64不匹配

发表回复 取消回复

发表回复取消回复