基于pandas中一列中的多个值从数据框中选择行

2024-09-27 07:18:24 发布

您现在位置:Python中文网/ 问答频道 /正文

这不是一个重复的问题,但类似于

Select rows from a DataFrame based on values in a column in pandas

在上一个链接中的答案中,它只基于一个标准,如果我有多个标准该怎么办。

我想在一个列中选择许多行,而不仅仅是基于特定值的行。为了便于讨论,请考虑世界银行的数据框架

import pandas.io.wb as wb
import pandas as pd
import numpy as np
df2= wb.get_indicators()

我选择certian值的方式是

df2.loc[df2['id'] == 'SP.POP.TOTL']

以及

df2.loc[df2['id'] == 'NY.GNP.PCAP.CD']

如何在一个新的数据帧中同时选择这两个,或者说3或4?这样,行是:

'SP.POP.TOTL'
'NY.GNP.PCAP.CD'

提前谢谢你


Tags: 数据inimportidpandas标准aspop
1条回答
网友
1楼 · 发布于 2024-09-27 07:18:24

您可以使用.isin()

In [28]: df2[df2['id'].isin(['SP.POP.TOTL','NY.GNP.PCAP.CD'])]
Out[28]:
                  id                                        name  \
7478  NY.GNP.PCAP.CD  GNI per capita, Atlas method (current US$)
9568     SP.POP.TOTL                           Population, total

                            source  \
7478  World Development Indicators
9568  World Development Indicators

                                             sourceNote  \
7478  GNI per capita (formerly GNP per capita) is th...
9568  Total population is based on the de facto defi...

                                     sourceOrganization  \
7478  b'World Bank national accounts data, and OECD ...
9568  b'(1) United Nations Population Division. Worl...

                                 topics
7478  Economy & Growth ; Climate Change
9568           Health  ; Climate Change

相关问题 更多 >

    热门问题