删除带单词的左括号和右括号

2024-09-30 18:32:55 发布

您现在位置:Python中文网/ 问答频道 /正文

给定数据帧:

df = 

                         multi
0 MULTIPOLYGON(((3 11, 2 33)))
1 MULTIPOLYGON(((4 22, 5 66)))

我试图删除单词'MULTIPOLYGON'和括号'(((','))'


我的尝试:

df['multi'] = df['multi'].str.replace(r"\(.*\)","")
df['multi'] = df['multi'].map(lambda x: x.lstrip('MULTIPOLYGON()').rstrip('aAbBcC'))

df.values = 

array([[''],
       [''],
       ...
       [''],
       [''],
       [''],
       ['7.5857754821 44.9628409423']

期望输出:

df = 

     multi
3 11, 2 33
 4 22, 5 6

Tags: 数据lambdamapdf单词arraymultireplace
3条回答

你可以用数据框列结构以下面的方式。你知道吗

df['a'] = df['a'].str.findall(r'[0-9.]+')
df = pd.DataFrame(df['a'].tolist())
print(df)

输出:

     0     1
0  3.49  11.10
1  4.49  22.12

这将适用于任意数量的列。但最后你必须给这些列命名。你知道吗

df.columns = ['a'+str(i) for i in range(df.shape[1])]

即使某些行具有不同数量的数值,此方法也会起作用。就像

df =pd.DataFrame({'a':['MULTIPOLYGON(((3.49)))' ,'MULTIPOLYGON(((4.49 22.12)))']})

     a
 0  MULTIPOLYGON(((3.49)))
 1  MULTIPOLYGON(((4.49 22.12)))

所以预期的输出是

      0     1
0   3.49    None
1   4.49    22.12

在使用命名列之后

df.columns = ['a'+str(i) for i in range(df.shape[1])]

你得到了

      a0    a1
0   3.49    None
1   4.49    22.12

试试这个:

    import pandas as pd
import re 
def f(x):
    x = ' '.join(re.findall(r'[0-9, ]+',x))
    return x

def f2(x):
    x = re.findall(r'[0-9, ]+',x)

    return pd.Series(x[0].split(','))       


df =pd.DataFrame({'a':['MULTIPOLYGON(((3 11, 2 33)))' ,'MULTIPOLYGON(((4 22, 5 6)))']})
df['a'] = df['a'].apply(f)
print(df)
#or for different columns you can do
df =pd.DataFrame({'a':['MULTIPOLYGON(((3 11, 2 33)))' ,'MULTIPOLYGON(((4 22, 5 6)))']})
#df['multi'] = df.a.str.replace('[^0-9. ]', '', regex=True)
#print(df)
list_of_cols = ['c1','c2']
df[list_of_cols] = df['a'].apply(f2)
del df['a']
print(df)

输出:

            a
0  3 11, 2 33
1   4 22, 5 6
     c1     c2
0  3 11   2 33
1  4 22    5 6
[Finished in 2.5s]

也可以将^{}与正则表达式一起使用:

# removes anything that's not a digit or a space or a dot
df['multi'] = df.multi.str.replace('[^0-9\. ]', '', regex=True)#changing regex

相关问题 更多 >