我正在尝试使用Tensorflow编写这里给出的gazecapture模型的代码:
http://gazecapture.csail.mit.edu/cvpr2016_gazecapture.pdf
在模型的末尾,眼睛数据、面部数据和面部网格数据已经被简化为三个不同的全连接层,分别为1×128、1×64和1×128大小。权重似乎没有共享,但它们以某种方式结合成一个最终的全连接层。我缺少将这些层连接起来形成最终全连接层的链接。
这是如何实现的?其他地方有这方面的例子吗?
如果有帮助的话,原始项目的github位于这里:
https://github.com/CSAILVision/GazeCapture
谢谢你!如果这是一个初级错误,我提前道歉。
回答:
很好,所以眼睛、面部和面部网格数据已经各自简化为各自的全连接层,这使得事情变得简单。我们可以使用Tensorflow中的内置函数进行拼接,如下所示
big_fcl = tf.concat([eye_fcl, face_fcl, face_grid_fcl], 1)
(‘fcl’代表’全连接层’)
现在big_fcl的大小为128+64+128。
完成!