numpy:为什么(x,1)和(x,)维度之间有区别

2024-05-10 05:44:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我想知道为什么在numpy中有一维数组(length,1)和一维数组(length,1),没有第二个值。

我经常遇到这种情况,例如在使用np.concatenate()时,这需要预先执行reshape步骤(或者我可以直接使用hstack/vstack)。

我想不出为什么这种行为是可取的。有人能解释吗?

编辑:
其中一条评论说,我的问题可能是重复的。我更感兴趣的是Numpy的底层工作逻辑,而不是1d和2d数组之间的区别,我认为这是上述线程的重点。


Tags: numpy编辑np评论情况步骤数组length
2条回答

其中大部分是语法问题。这个元组根本不是元组(只是一个冗余)。^但是{}是。

(x,)和(x,1)之间的差别更大。你可以看看前面的问题的例子,比如this。引用它的示例,这是一个1D numpy数组:

>>> np.array([1, 2, 3]).shape
(3,)

但这个是二维的:

>>> np.array([[1, 2, 3]]).shape
(1, 3)

Reshape does not make a copy unless it needs to所以它应该是安全的。

一个ndarray的数据被存储为一个1d缓冲区——只是一个内存块。数组的多维特性由shapestrides属性以及使用它们的代码生成。

开发人员选择允许任意数量的维度,因此形状和跨距表示为任意长度的元组,包括0和1。

相反,MATLAB是围绕FORTRAN程序构建的,这些程序是为矩阵运算而开发的。在早期,MATLAB中的一切都是二维矩阵。大约在2000年(v3.5)它被普遍允许超过2d,但绝不少于2d。numpynp.matrix仍然遵循旧的2d MATLAB约束。

如果你来自一个MATLAB世界,你就习惯了这两个维度,以及行向量和列向量之间的区别。但在数学和物理中,不受MATLAB影响的向量是一维数组。Python列表本质上是1d,就像c数组一样。要获得2d,必须有指向数组的列表或指针数组的列表,使用x[1][2]索引样式。

看看这个数组及其变体的形状和步幅:

In [48]: x=np.arange(10)

In [49]: x.shape
Out[49]: (10,)

In [50]: x.strides
Out[50]: (4,)

In [51]: x1=x.reshape(10,1)

In [52]: x1.shape
Out[52]: (10, 1)

In [53]: x1.strides
Out[53]: (4, 4)

In [54]: x2=np.concatenate((x1,x1),axis=1)

In [55]: x2.shape
Out[55]: (10, 2)

In [56]: x2.strides
Out[56]: (8, 4)

MATLAB在末尾添加了新的维度。它像order='F'数组一样对其值进行排序,并且可以很容易地将(n,1)矩阵更改为(n,1,1)。numpy是默认的order='C',并且很容易在开始时扩展数组维度。在利用广播时,了解这一点至关重要。

因此x1 + x是a(10,1)+(10,)=>;(10,1)+(1,10)=>;(10,10)

因为广播一个(n,)数组比一个(n,1)数组更像一个(1,n)数组。一维数组更像是行矩阵而不是列矩阵。

In [64]: np.matrix(x)
Out[64]: matrix([[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]])

In [65]: _.shape
Out[65]: (1, 10)

concatenate的点是它需要匹配的维度。它不使用广播来调整尺寸。有很多stack函数可以缓解这个约束,但是它们是通过在使用concatenate之前调整维度来实现的。看看他们的代码(可读的Python)。

因此,一个熟练的numpy用户需要熟悉这个广义的shape元组,包括空的()(0d数组)、(n,)1d以及更高的元组。对于更高级的东西,理解跨步也有帮助(比如看跨步和转置的形状)。

相关问题 更多 >