“从中提取数字”日AAA级日BBB或AAA日BBB公司日"

1条回答

网友

1楼 · 发布于 2024-10-02 08:15:21

至少在这些情况下，您可以尝试以下操作：

1/找出谁是第一个脑电图或滴滴涕：

In [11]: s.str.extract("(DDT|EEG)")
Out[11]:
     0
0  DDT
1  DDT
2  DDT
3  EEG
4  EEG

2/拔出所有的号码：

In [12]: s.str.extract("(\d+\.?\d*|N/A).*?(\d+\.?\d*|N/A)")
Out[12]:
        0     1
0  42.121   2.1
1      12  23.2
2      47    22
3     N/A    43
4       5    20

要摆脱N/A，您可以向\u numeric申请：

In [13]: res = s.str.extract("(\d+\.?\d*|N/A).*?(\d+\.?\d*|N/A)").apply(pd.to_numeric, errors='coerce', axis=1)

In [14]: res
Out[14]:
        0     1
0  42.121   2.1
1  12.000  23.2
2  47.000  22.0
3     NaN  43.0
4   5.000  20.0

现在您必须重新排列这些列以匹配其各自的DDT/EEG：

In [15]: pd.DataFrame({
           "DDT": res[0].where(s.str.extract("(DDT|EEG)")[0] == 'DDT', res[1]),
           "EEG": res[1].where(s.str.extract("(DDT|EEG)")[0] == 'DDT', res[0])
         })
Out[15]:
      DDT   EEG
0  42.121   2.1
1  12.000  23.2
2  47.000  22.0
3  43.000   NaN
4  20.000   5.0

这里s是原始系列/列：

In [21]: s
Out[21]:
0    This contains 42.121% DDT and 2.1% EEG
1              Now with DDT: 12% EEG: 23.2%
2                             47 DDT 22 EEG
3                            EEG N/A DDT 43
4                   5% EEG 20% DDT and more
dtype: object

这假设DDT和EEG都存在，您可能需要找出不存在这种情况的行（只有DDT/EEG中的一个）。。。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

“从中提取数字”日AAA级日BBB或AAA日BBB公司日"

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >