如何使用Pandas删除列值中URL字符串的第一部分？

3条回答

网友

1楼 · 编辑于 2024-09-28 05:19:13

您可以使用re（如果要提取的部分之前的部分始终相同）

import re

idx = re.search(r':zib:', myID)
myNewID = myID[idx.end():]

然后你将有：

myNewID

'b1234567-9ee6-11b7-b4a2-7b8c2344daa8d'

网友

2楼 · 编辑于 2024-09-28 05:19:13

您可以在此处尝试替换正则表达式：

df['myID'] = df['myID'].str.replace('^.*:', '', regex=True)

这种方法是简单地删除从MyID开始到最后一个冒号（包括冒号）的所有内容。这将留下您想要保留的UUID

网友

3楼 · 编辑于 2024-09-28 05:19:13

使用lstrip，可以从字符串中删除与作为参数传递的字符集匹配的所有字符。因此：

string = abcd
test = string.lstrip(ad)
print(test)

如果要去除字符串的前x个字符，可以像数组一样对其进行切片。对你来说，这就像：

df['myID'] = df['myID'].map(lambda x: x[:-37])

但是，要使其工作，您希望从字符串中获取的部分应该具有恒定的大小