Pandas系列：删除某个字符之前的所有内容，如果“所有内容”每次都更改

ingredssplit 0 MAGERMILCH 65% 1 Wasser 2 Keks gemahlen 6% (WEIZENMEHL 3 Traubensaftkonzentrat 4 Palmöl) 5 Stärke 6 Maiskeimöl 7 Zucker 8 Antioxidationsmittel Ascorbinsäure¹ 9 Thiamin (Vitamin B1). dtype: object``

2条回答

网友

1楼 · 编辑于 2024-06-28 20:07:57

试试^{}：

df.loc[[2], 'ingredssplit'] = (
    df.loc[[2], 'ingredssplit'].str.extract('.*\((.*)')[0]
)

网友

2楼 · 编辑于 2024-06-28 20:07:57

好吧，我找到了解决办法。谢谢jcaliz，'.*\(部分是金色的！这就是我所做的：

   item1 = []
   for line in ingredssplit:
       line=re.sub('.*\(', '', line)
       item1.append(line)  
        
    def remove_punc(string):
        punc = '''!()-[]{};:'"\,<>./?@#$^&*_~'''
        for ele in string:  
            if ele in punc:  
                string = string.replace(ele, "") 
        return string
    lis = [remove_punc(i) for i in item1]
    lis = list(filter(None, lis))
    lis=[i.lstrip() for i in lis]
    lis=[i.rstrip() for i in lis]
    lis

这给了我一个清单：

['MAGERMILCH 65%',
 'Wasser',
 'WEIZENMEHL',
 'Traubensaftkonzentrat',
 'Palmöl',
 'Stärke',
 'Maiskeimöl',
 'Zucker',
 'Antioxidationsmittel Ascorbinsäure¹',
 'Vitamin B1']

我可以轻松地将其转换为数据帧，例如：

lis=pd.DataFrame(lis)
lis
                 0

0   MAGERMILCH 65%
1   Wasser
2   WEIZENMEHL
3   Traubensaftkonzentrat
4   Palmöl
5   Stärke
6   Maiskeimöl
7   Zucker
8   Antioxidationsmittel Ascorbinsäure¹
9   Vitamin B1

谢谢大家！：）

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas系列：删除某个字符之前的所有内容，如果“所有内容”每次都更改

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >