当列包含“列表”而不是“元组”时，比较运算符“==”未按预期工作`

网友

1楼 · 编辑于 2024-06-26 07:09:20

问题是pandas将[1, 2]视为类似于对象的系列，并试图将df.Li的每个元素与[1, 2]的每个元素进行比较，因此出现错误：

ValueError: Lengths must match to compare

无法将大小为2的列表与大小为3的列表进行比较（df.Li）。为了验证这一点，您可以执行以下操作：

print(df.Li == [1, 2, 3])

输出

0    False
1    False
2    False
Name: Li, dtype: bool

它不会抛出任何错误并正常工作，但会按预期返回False。要使用列表进行比较，可以执行以下操作：

# this creates an array where each element is [1, 2]
data = np.empty(3, dtype=np.object)
data[:] = [[1, 2] for _ in range(3)]

print(df.Li == data)

输出

0     True
1    False
2    False
Name: Li, dtype: bool

总的来说，它看起来像熊猫那边的一只虫子

网友
2楼 · 编辑于 2024-06-26 07:09:20

问题是list是不可散列的，因此有必要比较tuples：
print (df.Li.map(tuple) == (1,2)) 0 True 1 False 2 False Name: Li, dtype: bool
或在列表理解中：
mask = [tuple(x) == (1,2) for x in df.Li] #alternative mask = [x == [1,2] for x in df.Li] print (mask) [True, False, False]
如果所有列表的长度相同：
mask = (np.array(df.Li.tolist()) == [1,2]).all(axis=1) print (mask) [ True False False]

网友
3楼 · 编辑于 2024-06-26 07:09:20

我的列“vectors”包含numpy ndarray，当我想与另一个ndarray“centroid”进行比较时，我得到了相同的错误。numpy Ndarays的以下工程：

df['vectors'].apply(lambda x: ((vec==centroid).sum() == centroid.shape[0]))

这也适用于列表：

df.Li.apply(lambda x: x==[1,2])

相关问题更多 >

编程相关推荐

热门问题

热门文章