我正在尝试为训练二分类语义分割网络创建数据批次。目标分割图像有两层,第一层对于类别1的所有像素值为1,其他像素值为0。第二层像素值则相反。
在我的数据集中,输出图像是3通道RGB图像,颜色值为[255,255,255]
和[0,0,0]
。输入和输出图像存储在tf-record文件中。
我在numpy中进行实验时,使用以下代码创建了一个2通道二值图像:
c1_pix = np.all(op_img == np.array([255,255,255]), axis=2)c1_pix = c1_pix.reshape(*(h,w), 1)op_arr = np.concatenate((c1_pix, np.invert(c1_pix)), axis=2)
这给我生成了我想要的2层1和0的图像。
我试图在tensorflow中重复这个操作,我对tensorflow是新手。我尝试了c1_pix = tf.where(tf.equal(op_img, [[[255,255,255]]]))
。看起来是有效的,但它返回了一个3通道int64张量,包含1和0,我无法对其进行反转。
能有人帮我解决这个问题吗?
谢谢,
回答:
在研究了一段时间的tf文档后,我找到了以下解决方案
c1_pix, _, _ = tf.split(tf.equal(op_img,[[[255,255,255]]]), 3, axis=-1)c2_pix = tf.logical_not(c1_pix)new_op_img = tf.concat([c1_pix, c2_pix], -1)
这个方法对我有效。