我理解不同输入的加权以及如何用来计算成本,基本上就是这样:
我还知道它可以用来构建更深层次的网络,但是网络如何处理像RGB图像这样的数据,其中一些数据天生是捆绑在一起的呢?
回答:
假设我们有一张宽度为w、高度为h的图像(w = 宽度,h = 高度)。
最直接的方法是简单地创建w * h * 3个输入节点;对于每个像素,设置三个输入节点(一个用于R值,一个用于G值,一个用于B值)。如果有足够大的训练数据集,以这种方式分割数据应该不会有问题。
你说的对,起初确实会丢失一些信息;网络的结构中并没有什么固有的特性告诉它前三个输入节点之间是相互关联的(同一个像素),之后的三个也是如此,等等。然而,给定足够多的训练数据,理论上它应该能够识别出这种模式。
根据问题领域的不同,完全去掉颜色信息也可能是有益的。你可以将图像转换为灰度,这样每个像素只需要一个输入节点。当然,这样做也会丢失信息,但对于某些任务,这些信息可能不是必需的(而且去掉它可以使你的训练在计算上更有效率)。