使用tfidf作为输入的CNN

我正在使用CNN进行假新闻检测,我对使用Keras和TensorFlow编写CNN代码还不熟练。我需要帮助来创建一个CNN模型,该模型以长度为100的向量形式的语句作为输入,并根据其预测的真假值输出0或1。

X_train.shape# 10229, 100X_train = np.expand_dims(X_train, axis=2)X_train.shape# 10229,100,1# actual cnn model hereimport tensorflow as tffrom tensorflow.keras import layers# Conv1D + global max poolingfrom keras.layers import Conv1D, MaxPooling1D, Embedding, Dropout, Flatten, Densefrom keras.layers import Inputtext_len=100from keras.models import Modelinp = Input(batch_shape=(None, text_len, 1))conv2 = Conv1D(filters=128, kernel_size=5, activation='relu')(inp)drop21 = Dropout(0.5)(conv2)conv22 = Conv1D(filters=64, kernel_size=5, activation='relu')(drop21)drop22 = Dropout(0.5)(conv22)pool2 = MaxPooling1D(pool_size=2)(drop22)flat2 = Flatten()(pool2)out = Dense(1, activation='softmax')(flat2)model = Model(inp, out)model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])model.summary()model.fit(X_train, Y_train)

如果有人能提供一个带有一点解释的工作代码,我将非常感激


回答:

在这个示例中,我使用了具有2D特征的Conv1D。Conv1D接受3D格式的序列输入(n_samples, time_steps, features)。如果您使用的是2D特征,您需要将其调整为3D。通常的选择是将您的特征视为是简单扩展的时间维度(在axis 1上使用expand_dims),对于tfidf/独热编码特征,没有理由假设位置/时间模式。

当您构建神经网络时,您从3D维度开始,并且需要转换为2D。从3D到2D有很多可能性,最简单的是展平,如果您只有一个时间维度,池化层是无用的。如果您在最后一层使用softmax作为激活函数,请记住在您的Dense层中设置维度等于您的类别数量

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注