我的问题只涉及到这段代码中非常小的一部分,但我还是把整段代码都贴出来,以防有帮助。这段代码来自于http://neuralnetworksanddeeplearning.com/chap1.html#implementing_our_network_to_classify_digits(从这里往下滚动可以看到代码解释)
除非需要回顾理解数据结构,否则可以忽略大部分代码。首先,在backprop
方法中,大约中间位置的self.cost_derivative(activations[-1], y)
这一行,我们可以看到传递了两个值 – 据我所知,这两个值都是数组(当我输出它们时可以看到这一点,作者也对此进行了解释)。在cost_derivative
方法中,它所做的只是减去这两个值 – 但它们是数组,那么这是如何工作的呢?
当我在Python中这样做时,我理所当然地得到了一个错误
a = [1,2,4]b = [5,6,7]print(a-b)
我认为这可能与它们是numpy数组有关?
另外,类似的现象也发生在sigmoid
和sigmoid_prime
函数中,其中z
是一个数组(参见这些函数被调用时,参数是数组的地方)…尽管函数将其视为单个值…这是如何工作的?我假设它只是对数组中的每个值进行操作?
本质上,我不断看到一些我认为只能对单个值起作用的功能,却能对数组起作用。
感谢任何解释,我发布的链接中有更多的解释。
回答:
您是对的,减法之所以能工作,是因为output_activations
和y
是numpy数组。Numpy是Python用于快速矩阵操作的库,numpy数组重载了-
运算符以执行矩阵减法。
然而,在您的示例中,[1,2,4]
只是一个普通的Python列表,不是numpy数组,而-
运算符对列表没有定义。如果您用numpy数组替换您的列表,输出将更有意义: