datafram中的单词删除

2024-09-29 21:24:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个示例数据帧,我希望删除所有单词并保留值。你知道吗

Column1    Column2    Column3    Column4                     Column5
5FQ        1.047      S$55.3     UG44.2 as of 02/Jun/2016    S$8.2 mm

有没有可能放下字眼,保留所有的数字?IE:要获得以下所需结果:

Column1    Column2    Column3    Column4    Column5
5          1.047      55.3       44.2       8.2

Tags: of数据示例as数字单词junmm
2条回答

您可以使用^{}

In [28]: for c in df:
    df[c] = df[c].str.extract('(\d+\.?\d*)', expand=False)
   ....:     

In [29]: df
Out[29]: 
  Column1 Column2 Column3 Column4 Column5
0       5   1.047    55.3    44.2     8.2

请注意,这有点脆弱,因为在Column4中,它是有效的,因为日期出现在数量之后。不过,你的问题没有说得更确切。你知道吗

一种方法是:

In [212]: df
Out[212]: 
  Column1  Column2 Column3                   Column4   Column5
0     5FQ    1.047  S$55.3  UG44.2 as of 02/Jun/2016  S$8.2 mm

In [213]: df.apply(lambda x: x.astype(str).str.extract(r'(\d+\.?\d*)', expand=True).astype(np.float))
Out[213]: 
   Column1  Column2  Column3  Column4  Column5
0      5.0    1.047     55.3     44.2      8.2

相关问题 更多 >

    热门问题