如何过滤Pandas中的分类数据

sex age race Male 0.204082 Hispanic Male 0.122449 African-American Female 0.163265 African-American Male 0.081633 African-American Male 0.530612 African-American

2条回答

网友

1楼 · 编辑于 2024-09-27 04:21:46

诀窍是用~df['race'].isin(['a', 'b', c'])检查是否每个元素都（不是）在给定的列表中。下面是一个例子：

from io import StringIO as sio

data = sio("""
 sex     age         race        
    Male    0.204082    Hispanic    
    Male    0.122449    African-American    
    Female  0.163265    African-American    
    Male    0.081633    African-American    
    Male    0.530612    African-American
""")

import pandas as pd
df = pd.read_csv(data, sep='\s+').astype({'race': 'category'})

df_train_val_scaled = df[~df["race"].isin(["Native American", "Asian"])]
df_train_val_scaled

网友

2楼 · 编辑于 2024-09-27 04:21:46

您可以使用isin（）函数根据任何列值过滤数据帧，该函数返回一个布尔序列，该序列可以传递给数据帧以获得过滤结果。
您可以将此布尔序列传递给DataFrame，DataFrame根据传递的布尔序列过滤行后返回DataFrame

import pandas as pd

people = {
    'sex': ['Male', 'Male', 'Male', 'Female', 'Male'],
    'age': [0.204082, 0.163265, 0.204082, 0.214082, 0.204082],
    'race': ['Hispanic', 'African-American', 'Asian', 'Asian', 'Asian']
}

df = pd.DataFrame(people)

filter_ = ~df['race'].isin(['African-American', 'Asian'])

print(filter_)

# 0     True
# 1    False
# 2    False
# 3    False
# 4    False
# Name: race, dtype: bool

df_filtered = df[filter_]
print(df_filtered)

#     sex       age      race
# 0  Male  0.204082  Hispanic

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何过滤Pandas中的分类数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >