使用regex从dataframe Python中删除/排除列

df = pd.DataFrame({'person_id' :[1,2,3],'date1': ['12/31/2007','11/25/2009','10/06/2005'],'date1derived':[0,0,0],'val1':[2,4,6],'date2': ['12/31/2017','11/25/2019','10/06/2015'],'date2derived':[0,0,0],'val2':[1,3,5],'date3':['12/31/2027','11/25/2029','10/06/2025'],'date3derived':[0,0,0],'val3':[7,9,11]})

3条回答

网友

1楼 · 编辑于 2024-09-27 23:27:10

您可以使用零宽度负前瞻来确保字符串derived不会出现在任何地方：

^(?!.*?derived)

^匹配字符串的开头
(?!.*?derived)是确保derived不出现在字符串中的负先行模式

您的模式[^Derived]将匹配不属于D/e/r/i/v/e/D的任何单个字符。你知道吗

网友

2楼 · 编辑于 2024-09-27 23:27:10

df[[c for c in df.columns if 'derived' not in c ]]

输出

   person_id       date1  val1       date2  val2       date3  val3
0          1  12/31/2007     2  12/31/2017     1  12/31/2027     7
1          2  11/25/2009     4  11/25/2019     3  11/25/2029     9
2          3  10/06/2005     6  10/06/2015     5  10/06/2025    11

网友

3楼 · 编辑于 2024-09-27 23:27:10

^{}与^{}

df[df.columns.difference(df.filter(like='derived').columns,sort=False)]

   person_id       date1  val1       date2  val2       date3  val3
0          1  12/31/2007     2  12/31/2017     1  12/31/2027     7
1          2  11/25/2009     4  11/25/2019     3  11/25/2029     9
2          3  10/06/2005     6  10/06/2015     5  10/06/2025    11

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用regex从dataframe Python中删除/排除列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >