使用tflearn神经网络解决Kaggle泰坦尼克号问题

我已经用逻辑回归解决了泰坦尼克号问题,现在我想用神经网络来解决这个问题。但是我的模型总是返回1,这意味着存活,对于每一个测试输入。可能我的模型存在问题。我该如何解决这个问题?

train_data = pd.read_csv('data/train.csv')test_data = pd.read_csv('data/test.csv')#一些数据清洗过程#......X_train = train_data.drop("Survived",axis=1).as_matrix()Y_train = train_data["Survived"].as_matrix().reshape((891,1))X_test  = test_data.drop("PassengerId",axis=1).as_matrix()net = tflearn.input_data(shape=[None, 6])net = tflearn.fully_connected(net, 32)net = tflearn.fully_connected(net, 32)net = tflearn.fully_connected(net, 1, activation='softmax')net = tflearn.regression(net)model = tflearn.DNN(net)model.fit(X_train, Y_train, n_epoch=10, batch_size=16, show_metric=True)pred = model.predict(X_test)print pred

回答:

在输出层使用softmax作为激活层,可以确保该层所有节点输出的总和为1。由于你只有一个节点,且输出必须总和为1,因此它按定义总是会输出1

在二分类任务中,你绝不应该使用softmax作为激活函数。一个更好的选择是逻辑函数,我认为tensorflow称之为sigmoid

所以不要使用

net = tflearn.fully_connected(net, 1, activation='softmax')

试试

net = tflearn.fully_connected(net, 1, activation='sigmoid')

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注