基于多个列表在Dataframe中创建新列

df['BroadCategory'] = np.where(df['VenueCategory'].isin(Bar),'Bar','Other') df['BroadCategory'] = np.where(df['VenueCategory'].isin(Museum_ArtGallery),'Museum/Art Gallery','Other') df['BroadCategory'] = np.where(df['VenueCategory'].isin(Public_Transport),'Public Transport','Other') df['BroadCategory'] = np.where(df['VenueCategory'].isin(Restaurant_FoodVenue),'Restaurant/Food Venue','Other')

3条回答

网友

1楼 · 编辑于 2024-06-25 23:52:02

您的解决方案已经接近。只是为了不覆盖以前的值，您应该获得行的子集，并且只在子集上设置新值

为此，您可以首先将新列BroadCategory初始化为“Other”。然后，通过使用.isin()函数（就像您现在使用的那样）使用布尔掩码为新列下标，设置每个类别的行子集。代码如下所示：

df['BroadCategory'] = 'Other'
df['BroadCategory'][df['VenueCategory'].isin(Bar)] = 'Bar' 
df['BroadCategory'][df['VenueCategory'].isin(Museum_ArtGallery)] = 'Museum/Art Gallery'
df['BroadCategory'][df['VenueCategory'].isin(Public_Transport)] = 'Public Transport'
df['BroadCategory'][df['VenueCategory'].isin(Restaurant_FoodVenue)] = 'Restaurant/Food Venue'
df['BroadCategory'][df['VenueCategory'].isin(Entertainment_Venue)] = 'Entertainment Venue'

网友

2楼 · 编辑于 2024-06-25 23:52:02

venue_list = [['Bar', Bar],
               ['Museum_ArtGallery',Museum_ArtGallery]
               #etc
               ]
venue_lookup = pd.concat([
    pd.DataFrame({
        'BroadCategory':venue[0],
        'VenueCategory':venue[1]}) for venue in venue_list]
        )
pd.merge(df, venue_lookup, how='left', on = 'VenueCategory')

网友

3楼 · 编辑于 2024-06-25 23:52:02

支持你的数据是这样的

df=pd.DataFrame({'VenueCategory':['drink','wine','MOMA','MTA','sushi','Hudson']})
Bar=['drink','wine','alcohol']
Museum_ArtGallery=['MOMA','MCM']
Public_Transport=['MTA','MBTA']
Restaurant_FoodVenue=['sushi','chicken']

准备字典：

from collections import defaultdict
d=defaultdict(lambda:'other')
d.update({x:'Bar' for x in Bar})
d.update({x:'Museum_ArtGallery' for x in Museum_ArtGallery})
d.update({x:'Public_Transport' for x in Public_Transport})
d.update({x:'Restaurant_FoodVenue' for x in Restaurant_FoodVenue})

生成新列并打印结果：

df['BroadCategory']=df['VenueCategory'].apply(lambda x:d[x])
df

相关问题更多 >

编程相关推荐

热门问题

热门文章