我有一个很大的数据集(appx1gb,有一列薪水范围,以字符串'20000-30000'为例。我想删除连字符后的所有内容并转换为浮点。然而,这并不总是存在的,所以我还需要一些条件来检查它是否存在。在
除了遍历整个列并逐个转换每个列之外,有没有一种快速的Pandas方法来实现这一点?我觉得这似乎是一个常见的问题,但是类似的问题并不能解决大数据集的问题。在
输入示例如下:
df = pd.DataFrame({'salary': ['200 - 300', '400', '400-500', '600', '-']})
df
Out:
salary
0 200 - 300
1 400
2 400-500
3 600
4 -
对于这些值,首选输出为:
^{pr2}$0
可以是任何填充值,我刚刚选择了0
。在
考虑数据帧
df
}
^{pr2}$pandas
^{
numpy
^{
这里有一种使用
apply
的方法另一种方法是使用
^{pr2}$regex
和字符串方法。在相关问题 更多 >
编程相关推荐