如何在pandas数据帧中格式化文本

2条回答

网友

1楼 · 编辑于 2024-05-18 19:23:57

您可以使用pandas .apply和re.sub删除{}，即：

import pandas as pd
import re
test = ['2694 A&W #5530 MONTREAL QC', 'ahi DOLLARAMA # 45 MONTREAL QC', 'PC - PAYMENT FROM - *****11*22']

def change_me(content):
    content =  re.sub(r"[^A-Z ]+", "", content, 0, re.IGNORECASE)
    return re.sub(r"[ ]{2,}", " ", content, 0, re.IGNORECASE)

df = pd.DataFrame({'Desc':test})
df.Desc = df.Desc.apply(change_me)

^{pr2}$

Regex Demo and Explanation

附言：
请阅读@ami的评论，.str.replace()是适合此类任务的函数。在

网友

2楼 · 编辑于 2024-05-18 19:23:57

尝试使用如下正则表达式：

df.Description = df.Description.str.replace(r'[\d#\-\*]', '')

这给了

^{pr2}$

编程相关推荐

java复选框。setOnCheckedChangeListener调用崩溃应用程序？
java如何模拟@InjectMocks类中的方法？
注释Java getter和setter
java是否锁定jar或DLL文件？
java绝对uri：http://www.slf4j.org/taglib/tld无法解决
java无法解析符号FirebaseMessagingService
java Glassfish 4中的性能调谐器在哪里？（优化树莓皮）
java获取同一页面上的内容标签
java NoClassDefFoundError，这里忽略了什么？（附图）
OnCreate中的java代码没有按顺序运行

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在pandas数据帧中格式化文本

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >