多索引的简单用例 - 问答 - Python中文网

多索引的简单用例

2024-09-30 16:30:24 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我试图在一个数据帧上编写一个简单的查询

我想选择所有的行WHERE A=0 and B>1，所以我希望作为输出

A B C
0 2 3.0
0 3 4.0

我定义我的数据帧如下

df = pd.DataFrame([{'A': 0, 'B': 1, 'C': 2.1}, {'A': 0, 'B': 2, 'C': 3.0}, {'A': 0, 'B': 3, 'C': 4.0}, {'A': 1, 'B': 0, 'C': 4.0}])

然后执行以下查询

df[ (df["A"] == 0) & (df["B"] > 1) ]

   A  B    C
1  0  2  3.0
2  0  3  4.0

它可以工作，但是在我的实际用例中它很慢，因为有更多的行。你知道吗

在浏览了pandasMultiIndexing doc之后，我不清楚如何使用索引来提高上述查询的性能。有没有一种方法可以使用索引来提高上述查询的性能？你知道吗

Tags： and 数据方法 dataframe df doc 定义用例

1条回答

网友

1楼 · 发布于 2024-09-30 16:30:24

您可以查询基础numpy数组而不是原始数据帧：

%timeit df[(df["A"] == 0) & (df["B"] > 1) ]
#1000 loops, best of 3: 1.23 ms per loop

ar = df.values
%timeit ar[(ar[:,0] == 0) & (ar[:,1] > 1)]
#100000 loops, best of 3: 11.5 µs per loop

如果要保留原始索引，请在运行查询之前将其转换为列，然后再返回索引。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章