在数据帧中搜索子串并替换i

2024-09-30 18:23:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个条件,虚假数据被创建,我试图清理它

例如

www.one@foxturn.com/!ut/5 #RealLink
www.one@foxturn.com/ut1/5_RTFDEERERTGFEFD # System adds junks to it
www.one@foxturn.com/ut1/5_dvkerfddfrejermsdkasmf # System adds junks to it

我正试图通过在!ut之后删除所有内容来清理这个问题

到目前为止,我已经尝试了:

SPA_MX = Mexico['Page URL'].str.startswith("http://www.www.one@foxturn.com/ut1")

但它返回一个布尔值

我想建议最有效的方法来实现这一点


Tags: to数据comwwwit条件systemone
2条回答
my_string="www.one@foxturn.com/!ut/5"
final =  my_string.split("!ut")[0]

输出:

www.one@foxturn.com/

可以使用列上的apply执行此操作,然后使用find返回模式的索引,如果找到str,则对其进行切片:

In[69]:

df['url'].apply(lambda x: x[:x.find('!ut') + 3] if x.find('!ut') != -1 else x)

Out[69]: 
0                             www.one@foxturn.com/!ut
1           www.one@foxturn.com/ut1/5_RTFDEERERTGFEFD
2    www.one@foxturn.com/ut1/5_dvkerfddfrejermsdkasmf
Name: url, dtype: object

相关问题 更多 >