在numpy和向量上下文中，(n,) 是什么意思？

我尝试在StackOverflow上搜索，使用Google搜索，甚至使用symbolhound进行字符搜索，但都未能找到答案。特别是，我对Nielsen的《神经网络与深度学习》第一章感到困惑，其中他提到“假设输入a是一个(n, 1) Numpy ndarray，而不是(n,) 向量。”

起初我以为(n,)指的是数组的方向——所以它可能指的是一个单列向量，而不是只有一个行的向量。但随后我不明白为什么我们需要(n,)和(n, 1)两种——它们似乎表达的是同一件事。我知道我误解了某些东西，但不确定是什么。

为参考，a指的是将输入到神经网络给定层的一组激活值向量，在通过权重和偏置转换以产生下一层的激活值输出向量之前。

编辑：这个问题混淆了“单列向量”（实际上不存在）和“单列矩阵”（确实存在）。同样适用于“单行向量”和“单行矩阵”。

向量只是一组数字，或者（等价地）是对向量空间基向量的标量变换列表。当我们写出向量时，如果它只有一行（或一列），它可能看起来像一个矩阵。令人困惑的是，我们有时会提到“激活值向量”，但实际上是指“激活值的单行矩阵经过转置后成为单列的”。

请注意，在这两种情况下，我们都没有讨论一维向量，这将是由一个数字定义的向量（除非，显然，n==1，在这种情况下，“列”或“行”的区别将毫无意义）。

回答：

在numpy中，数组可以有多种不同的维度，0、1、2等。

典型的二维数组具有维度(n,m)（这是一个Python元组）。我们倾向于描述它为有n行，m列。因此，(n,1)数组只有1列，而(1,m)有1行。

但因为数组可能只有1个维度，所以可能具有形状(n,)（Python中表示单元素元组的符号：更多信息请参见这里）。

在许多情况下，(n,)、(1,n)、(n,1)数组是等价的（还有(1,n,1,1)（4维））。它们都包含n个项，并且可以相互重塑。

但有时那个额外的1维度很重要。一个(1,m)数组可以与一个(n,1)数组相乘以产生一个(n,m)数组。一个(n,1)数组可以像(n,m)一样被索引，使用两个索引，x[:,0]，而(n,)只能接受x[0]。

MATLAB矩阵总是二维（或更高）。因此，从MATLAB转移概念的人倾向于期望有两个维度。有一个np.matrix子类，旨在模仿这一点。

对于numpy程序员来说，向量、行向量、列向量、矩阵之间的区别是松散的且相对不重要的。或者使用方式是从应用中派生出来的，而不是来自numpy本身。我认为这就是这本书中发生的情况——符号和期望来自numpy之外。

另见此答案，了解如何解释ndarrays中存储的数据的形状。它还提供了如何使用.reshape的见解：https://stackoverflow.com/a/22074424/3277902

学技术