Numpy串联列表,其中第一列在范围n中

2024-06-02 22:51:14 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图选择名为matrix的numpy矩阵中的所有行,其形状为(25323, 9),其中第一列的值在列表range_tuple上每个元组的startend范围内。最后,我想创建一个新的numpy矩阵,其结果是final的形状为(n, 9)。以下代码返回此错误:TypeError: only integer scalar arrays can be converted to a scalar index。我也尝试过用numpy.zeros((1,9))初始化final并使用np.concatenate,但得到了类似的结果。当我使用final.append(result)而不是使用np.concatenate时,确实会得到一个编译结果,但是矩阵的形状会丢失。我知道这个问题有一个合适的解决方案,任何帮助都将不胜感激

  final = []
  for i in range_tuples:
    copy = np.copy(matrix)
    start = i[0]
    end = i[1]
    result = copy[(matrix[:,0] < end) & (matrix[:,0] > start)]
    final = np.concatenate(final, result)

  final = np.matrix(final)

Tags: numpy列表nprange矩阵resultstartmatrix
3条回答
In [33]: arr                                                                                   
Out[33]: 
array([[ 0,  1,  2],
       [ 3,  4,  5],
       [ 6,  7,  8],
       [ 9, 10, 11],
       [12, 13, 14],
       [15, 16, 17],
       [18, 19, 20],
       [21, 22, 23]])
In [34]: tups = [(0,6),(3,12),(9,10),(15,14)]                                                  
In [35]: alist=[] 
    ...: for start, stop in tups: 
    ...:     res = arr[(arr[:,0]<stop)&(arr[:,0]>=start), :] 
    ...:     alist.append(res) 
    ...:                                                                                       

核对清单;注意元素的形状不同;有些是1行或0行。测试这些边缘情况是个好主意

In [37]: alist                                                                                 
Out[37]: 
[array([[0, 1, 2],
        [3, 4, 5]]), array([[ 3,  4,  5],
        [ 6,  7,  8],
        [ 9, 10, 11]]), array([[ 9, 10, 11]]), array([], shape=(0, 3), dtype=int64)]

vstack加入他们:

In [38]: np.vstack(alist)                                                                      
Out[38]: 
array([[ 0,  1,  2],
       [ 3,  4,  5],
       [ 3,  4,  5],
       [ 6,  7,  8],
       [ 9, 10, 11],
       [ 9, 10, 11]])

这里concatenate也起作用,因为默认轴为0,并且所有输入都已经是二维的

试试下面的方法

final = np.empty((0,9))
for start, stop in range_tuples:
    result = matrix[(matrix[:,0] < end) & (matrix[:,0] > start)]
    final = np.concatenate((final, result))

第一个是将final初始化为numpy数组。连接的第一个参数必须是数组的python列表,请参见docs。在代码中,它将result变量解释为参数axis的值

注释

  • 我使用元组解构来让循环更清晰
  • 不需要复印件
  • 附加列表可以更快。如果result始终具有相同的长度,则最终结果可以通过reshaping获得

我只需要创建一个布尔掩码来选择满足所需条件的行

编辑:我没有注意到您正在使用matrix(与ndarray相反)。答案已编辑为matrix

假设以下输入数据:

matrix = np.matrix([[1, 2, 3], [5, 6, 7], [2, 1, 7], [3, 4, 5], [8, 9, 0]])
range_tuple = [(0, 2), (1, 4), (1, 9), (5, 9), (0, 100)]

然后,首先,我将range_tuple转换为numpy.ndarray

range_mat = np.matrix(range_tuple)

现在,创建遮罩:

mask = np.ravel((matrix[:, 0] > range_mat[:, 0]) & (matrix[:, 0] < range_mat[:, 1]))

应用遮罩:

final = matrix[mask]  # or matrix[mask].copy() if you intend to modify matrix

检查:

print(final)
[[1 2 3]
 [2 1 7]
 [8 9 0]]

如果range_tuple的长度与matrix中的行数不同,则执行以下操作:

n = min(range_mat.shape[0], matrix.shape[0])
mask = np.pad(
    np.ravel(
        (matrix[:n, 0] > range_mat[:n, 0]) & (matrix[:n, 0] < range_mat[:n, 1])
    ),
    (0, matrix.shape[0] - n)
)
final = matrix[mask]

相关问题 更多 >