如何从数据框列中剥离/替换“域”？

3条回答

网友

1楼 · 编辑于 2024-09-29 21:46:27

您已经接近答案，只需使用：

df['name'] = df['name'].str.replace(r'.*\\', '', regex = True)

它只是使用您尝试过的代码之一中的r-string进行添加

在这里不使用r-string，该字符串相当于.*\\，它将被解释为最后一个正则表达式中的一个\。但是，使用r-string时，字符串将变成'.*\\\\'，每对\\将最终解释为一个\，最终结果将变成您期望的两个斜杠

输出：

0     computername1
1    computername45
2       servername1
3     computername3
4      servername64
Name: name, dtype: object

网友

2楼 · 编辑于 2024-09-29 21:46:27

您可以使用.str.split：

df["name"] = df["name"].str.split("\\", n=1).str[-1]
print(df)

印刷品：

             name
0   computername1
1  computername45
2     servername1
3   computername3
4    servername64

网友

3楼 · 编辑于 2024-09-29 21:46:27

没有使用ntpath.basename的正则表达式方法：

import pandas as pd
import ntpath
df = pd.DataFrame({'name':[r'domain1\computername1']})
df["name"] = df["name"].apply(lambda x: ntpath.basename(x))

结果：computername1

与rsplit一起：

df["name"] = df["name"].str.rsplit('\\').str[-1]