使用Python消除列中具有特定值的行

0 4028.44 4544434.50 -6.76 -117.00 0.0002 0.12 0 4028.50 3455014.50 -5.86 0 0.0003 0.39 0 7028.56 4523434.50 -4.95 -137.00 0.0005 0.25 0 8828.62 4543414.50 -3.05 0 0.0021 0.61 0 4028.44 4544434.50 -6.76 -107.00 0.0002 0.12 0 4028.50 3455014.50 -5.86 -11.00 0.0003 0.39 0 7028.56 4523434.50 -4.95 -127.00 0.0005 0.25 0 8828.62 4543414.50 -3.05 0 0.0021 0.61

3条回答

网友

1楼 · 编辑于 2024-04-28 02:29:32

假设您的数据位于这样的纯文本文件中：

$ cat data.txt 
0  4028.44  4544434.50    -6.76  -117.00  0.0002   0.12
0  4028.50  3455014.50    -5.86  0        0.0003   0.39
0  7028.56  4523434.50    -4.95  -137.00  0.0005   0.25
0  8828.62  4543414.50    -3.05  0        0.0021   0.61
0  4028.44  4544434.50    -6.76  -107.00  0.0002   0.12
0  4028.50  3455014.50    -5.86  -11.00   0.0003   0.39
0  7028.56  4523434.50    -4.95  -127.00  0.0005   0.25
0  8828.62  4543414.50    -3.05  0        0.0021   0.61

而且你没有使用任何外部库。下面的代码将把数据读入string的list，省略不需要的行。您可以将这些行输入到您选择的任何其他函数中。我调用print只是为了演示。N、 B:第五列有索引“4”，因为list索引是从零开始的。在

^{pr2}$

运行此程序时，您将获得：

$ python data.py 
1. Delete the rows which have '0' as a value on 5th column:
0  4028.44  4544434.50    -6.76  -117.00  0.0002   0.12
0  7028.56  4523434.50    -4.95  -137.00  0.0005   0.25
0  4028.44  4544434.50    -6.76  -107.00  0.0002   0.12
0  4028.50  3455014.50    -5.86  -11.00   0.0003   0.39
0  7028.56  4523434.50    -4.95  -127.00  0.0005   0.25

2. Choose the range (i.e. remove the rows which have values between -50 and 30 on 5th column):
0  4028.44  4544434.50    -6.76  -117.00  0.0002   0.12
0  7028.56  4523434.50    -4.95  -137.00  0.0005   0.25
0  4028.44  4544434.50    -6.76  -107.00  0.0002   0.12
0  7028.56  4523434.50    -4.95  -127.00  0.0005   0.25

网友

2楼 · 编辑于 2024-04-28 02:29:32

您可以使用numpy快速执行此操作：

data="""
0  4028.44  4544434.50    -6.76  -117.00  0.0002   0.12
0  4028.50  3455014.50    -5.86  0        0.0003   0.39
0  7028.56  4523434.50    -4.95  -137.00  0.0005   0.25
0  8828.62  4543414.50    -3.05  0        0.0021   0.61
0  4028.44  4544434.50    -6.76  -107.00  0.0002   0.12
0  4028.50  3455014.50    -5.86  -11.00   0.0003   0.39
0  7028.56  4523434.50    -4.95  -127.00  0.0005   0.25
0  8828.62  4543414.50    -3.05  0        0.0021   0.61
"""
from StringIO import StringIO
import numpy as np
d = np.loadtxt(StringIO(data)) # load the text in to a 2d numpy array

print d[d[:,4]!=0]  # choose column 5 != 0
print d[(d[:,4]>=50)|(d[:,4]<=-30)] # choose column 5 >=50 or <=-30

网友

3楼 · 编辑于 2024-04-28 02:29:32

goodrows = [row for row in data if row.split()[4] != '0']

或者

^{pr2}$

编辑：

如果您的数据实际上是在一个NumPy数组中，即使您的帖子没有这样做，您的评论似乎也表明了这一点：

goodrows = [row for row in data if row[4] != 0]

或者

goodrows = [row for row in data if not (-50 <= row[4] <= 30)]

应该行得通。当然，有一个新的内部方法来做到这一点。在

相关问题更多 >

编程相关推荐

热门问题

热门文章