Tensorflow embedding_lookup

我正在尝试通过TensorFlow的tf.nn.embedding_lookup()函数从头开始学习IMDB数据集的词表示。如果我理解正确的话,我需要在其他隐藏层之前设置一个嵌入层,然后在执行梯度下降时,该层将会在其权重中“学习”到词的表示。然而,当我尝试这样做时,我的嵌入层与网络的第一个全连接层之间出现了形状错误。

def multilayer_perceptron(_X, _weights, _biases):
    with tf.device('/cpu:0'), tf.name_scope("embedding"):
        W = tf.Variable(tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0),name="W")
        embedding_layer = tf.nn.embedding_lookup(W, _X)
        layer_1 = tf.nn.sigmoid(tf.add(tf.matmul(embedding_layer, _weights['h1']), _biases['b1']))
        layer_2 = tf.nn.sigmoid(tf.add(tf.matmul(layer_1, _weights['h2']), _biases['b2']))
        return tf.matmul(layer_2, weights['out']) + biases['out']

x = tf.placeholder(tf.int32, [None, n_input])
y = tf.placeholder(tf.float32, [None, n_classes])
pred = multilayer_perceptron(x, weights, biases)
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(pred,y))
train_step = tf.train.GradientDescentOptimizer(0.3).minimize(cost)
init = tf.initialize_all_variables()

我得到的错误是:

ValueError: Shapes TensorShape([Dimension(None), Dimension(300), Dimension(128)])and TensorShape([Dimension(None), Dimension(None)]) must have the same rank

回答:

形状错误的原因是您使用了一个二维张量x来索引一个二维嵌入张量W。可以将tf.nn.embedding_lookup()(及其近亲tf.gather())视为将x中的每个整数值i替换为W[i, :]行。从错误消息中可以推断出n_input = 300embedding_size = 128。一般来说,tf.nn.embedding_lookup()的结果维数等于rank(x) + rank(W) - 1…在这种情况下,为3。当您尝试将此结果乘以_weights['h1'](这是一个二维矩阵)时,就会出现错误。

要修复此代码,取决于您试图做什么,以及为什么要将输入矩阵传递给嵌入。一个常见的做法是使用像tf.reduce_sum()这样的操作,将每个输入示例的嵌入向量聚合成每示例一行的单个行。例如,您可以这样做:

W = tf.Variable(
    tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0) ,name="W")
embedding_layer = tf.nn.embedding_lookup(W, _X)
# 沿着维度1(`n_input`)进行聚合,以获得每个输入示例的单个向量(行)。
embedding_aggregated = tf.reduce_sum(embedding_layer, [1])
layer_1 = tf.nn.sigmoid(tf.add(tf.matmul(
    embedding_aggregated, _weights['h1']), _biases['b1'])) 

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注