我有Pandas阵列，它最初是一个csv文件。我想从列中的所有行中删除一个特定单词：tex

id text spam 4016 Subject: re : vacation vince : i just found ... 0 4017 Subject: re : receipts from visit jim , than... 0 4018 Subject: re : enron case study update wow ! a...0 4019 Subject: re : interest david , please , call... 0 4020 Subject: news : aurora 5 . 2 update aurora ve...0

id text spam 4016 re : vacation vince : i just found ... 0 4017 re : receipts from visit jim , than... 0 4018 re : enron case study update wow ! a...0 4019 re : interest david , please , call... 0 4020 news : aurora 5 . 2 update aurora ve...0

2条回答

网友

1楼 · 编辑于 2024-05-20 15:46:28

试试这个：

df.text = df.text.apply(lambda row: row[9:])

每行将在“文本”列更改，其中前9个字符“主题：”将被删除

网友

2楼 · 编辑于 2024-05-20 15:46:28

我认为您需要^{}-^表示每个字符串的开头和\s+一个或多个空格：

df['text'] = df['text'].replace('^Subject:\s+', '', regex=True)
print (df)
     id                                     text  spam
0  4016   re : vacation vince : i just found ...     0
1  4017   re : receipts from visit jim , than...     0
2  4018  re : enron case study update wow ! a...     0
3  4019   re : interest david , please , call...     0
4  4020  news : aurora 5 . 2 update aurora ve...     0

但是如果需要删除第一个9字符，包括whitespace：

df['text'] = df['text'].str[9:]

相关问题更多 >

编程相关推荐

热门问题

热门文章