在“String”类型的pd.dataframe上使用iloc时，字符串比较始终为false

2条回答

网友

1楼 · 编辑于 2024-10-08 19:19:48

尝试按“布尔索引”筛选：

https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#boolean-indexing

这篇文章用很好的例子详细地解释了这一点：

https://appdividend.com/2019/01/25/pandas-boolean-indexing-example-python-tutorial/

因此，如果您有此数据集：

nested_lists = [
    ['Country1', 'Region1', 'City1', 1, 5], 
    ['Country1', 'Region1', 'City2', 7, 8], 
    ['Country1', 'Region2', 'City3', 3, 4], 
    ['Country2', 'Region2', 'City4', 6, 8]
] 

df = pandas.DataFrame(nested_lists, columns = ['Country', 'Region', 'City', 'Population', 'Cases'])

您可以通过以下方式按国家和地区进行筛选：

df_filtered = df[(df['Country'] == 'Country1') & (df['Region'] == 'Region1')]

结果:

Country     Region  City    Population  Cases
Country1    Region1 City1   1           5
Country1    Region1 City2   7           8

要仅获取“案例”列，请执行以下操作：

df_filtered2 = df[(df['Country'] == 'Country1') & (df['Region'] == 'Region1')][['Cases']]

结果:

Cases
5
8

网友

2楼 · 编辑于 2024-10-08 19:19:48

我不知道这是否是您的问题，因为我不确定您的数据帧到底是什么样子，因为我只有您给我的代码中的列。但是看起来你的区域从来就不是Sicilia，它前面似乎有一个单词，在这种情况下，你的第二个if语句将始终返回false

我想你想把它改成类似

pop_sud = [
    int(df.iloc[i][3]) 
    for i in range(len(df.index)) 
    if str(df.iloc[i][0])=='Italy'
    if df['Region'].str.contains('Sicilia')[i]
]

您也可以在不理解列表的情况下执行此操作，代码如下所示

pop_sud = df.query(
    "Country == 'Italy' & 
    Region.str.contains('Sicilia')"
)['Cases'].astype(int).tolist()

相关问题更多 >

编程相关推荐

热门问题

热门文章

在“String”类型的pd.dataframe上使用iloc时，字符串比较始终为false

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >