我想用Keras创建一个简单的分类器来对我的数据进行分类。特征是数值数据,结果是字符串/分类数据。我要预测15个不同的类别/分类。我的代码如下所示:
model = Sequential()model.add(Dense(16, input_dim = x_train.shape[1], activation = 'relu')) # 输入层需要input_dim参数model.add(Dense(16, activation = 'relu'))model.add(Dense(16, activation = 'relu'))model.add(Dense(1, activation='relu'))model.compile(loss="binary_crossentropy", optimizer= "adam", metrics=['accuracy'])#es = EarlyStopping(monitor='loss', min_delta=0.005, patience=1, verbose=1, mode='auto')model.fit(x_train, y_train, epochs = 100, shuffle = True, batch_size=128, verbose=2)scores = model.evaluate(x_test, y_test)print(model.metrics_names[0], model.metrics_names[1])
问题是我总是收到这个错误:
ValueError: could not convert string to float 'category1'
我做错了什么?
当我用整数替换我的类别名称“category1”、“category2”等时,我的代码可以运行,但总是给我0的准确率。我尝试过更改节点和层数以及激活函数,但结果总是0。似乎模型认为我是在做回归而不是分类。
如果我的分类值不仅仅是1或0,使用Keras进行分类的正确方法是什么?
回答:
你需要将字符串类别转换为整数,有一种方法可以做到这一点:
y_train = tf.keras.utils.to_categorical(y_train, num_classes=num_classes)
此外,对于多类分类,最后一层应该类似于:
model.add(Dense(NUM_CLASSES, activation='softmax'))
最后,对于多类分类,正确的损失函数应该是分类交叉熵。
model.compile(loss="categorical_crossentropy", optimizer= "adam", metrics=['accuracy'])
这是来自tensorflow的一个很好的例子:分类示例