我有一个批次的图像,每张图像中都需要对一个小区域进行操作。现在的问题是,每张图像中的小区域大小是可变的。这意味着我无法将其向量化。虽然我可以通过考虑图像中的所有像素范围来进行向量化,但每张图像的区域大小只占很小的一部分,我不想通过对每张图像的所有像素进行操作并存储结果来浪费内存。
简而言之,我需要使用循环。现在我看到TensorFlow只定义了while循环,没有for循环。所以我的问题是,如果我使用普通的Python风格的for循环来对我的张量进行操作,自动微分在我的图中是否会无法计算梯度?
回答:
TensorFlow并不知道(因此也不关心)图是如何构建的,你甚至可以手动编写每个节点,只要使用适当的函数来完成即可。特别是,for循环与TF无关。另一方面,TF的while循环允许你在图内表达动态计算,因此如果你想要按顺序处理数据,并且只需要在内存中保留当前数据——只有while循环能实现这一点。如果你通过循环手动创建一个巨大的图,它将始终被执行,并且所有内容都存储在内存中。只要这在你的机器上可行,你应该没问题。另一个问题是动态长度,如果有时你需要运行循环10次,有时需要1000次,你必须使用tf.while_loop,你不能用for循环做到这一点(除非你为每种可能的长度创建单独的图)。