Pandas Python Regex:错误：没有要表示的内容

import pandas as pd import numpy as np data = {'year': [2010, 2011, 2012, 2011, 2012, 2010, 2011, 2012], 'team': ['Bears', 'Bears', 'Bears', 'Packers', 'Packers', 'Lions', 'Lions', 'Lions'], 'wins': [11, '*', 10, '-', 11, 6, 10, 4], 'losses': [5, 8, 6, 1, 5, 10, 6, 12]} football = pd.DataFrame(data, columns=['year', 'team', 'wins', 'losses'])

3条回答

网友

1楼 · 编辑于 2024-07-08 11:22:28

*是正则表达式中的一个特殊字符，必须对其进行转义：

football.replace(['\*','-'], ['0.00','0.00'], regex=True).astype(np.float64)

或者使用字符类：

^{pr2}$

网友

2楼 · 编辑于 2024-07-08 11:22:28

你可以在dict理解中使用列表理解来实现这一点

>>> {key: [i if i not in {'*','-'} else '0.00' for i in values] for key, values in data.items()}
{'year': [2010, 2011, 2012, 2011, 2012, 2010, 2011, 2012],
 'wins': [11, '0.00', 10, '0.00', 11, 6, 10, 4],
 'losses': [5, 8, 6, 1, 5, 10, 6, 12],
 'team': ['Bears', 'Bears', 'Bears', 'Packers', 'Packers', 'Lions', 'Lions', 'Lions']}

这样做是为了在生成DataFrame之前清理data。在

网友

3楼 · 编辑于 2024-07-08 11:22:28

做

football.replace(['*','-'], ['0.00','0.00'], regex=False)

也就是说，对于只匹配一个字符或另一个字符的简单情况，不需要使用正则表达式

或者，如果您想使用正则表达式，请注意*是一个特殊字符；如果您想完全匹配'*'或{}的值，请使用

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章