Pandas保留前n个字符，其中n在列n中定义

In [1] data = {"Names": ["JakeJake", "ThomasThomas", "HarryHarry"], "Scores": [70, 81, 23]} df = pd.DataFrame(data) Out [1] Names Scores 0 JakeJake 70 1 ThomasThomas 81 2 HarryHarry 23

3条回答

网友

1楼 · 编辑于 2024-09-30 20:26:51

您可以在Names列上使用apply，然后只获取所需字符串的一部分

>>> df.assign(x=df['Names'].apply(lambda x: x[:len(x)//2]))

          Names  Scores       x
0      JakeJake      70    Jake
1  ThomasThomas      81  Thomas
2    HarryHarry      23   Harry

网友

2楼 · 编辑于 2024-09-30 20:26:51

使用regex提取名称，使用str.len提取长度：

df["X"] = df.Names.str.extract(r"^(.+)\1$")
df["N"] = df.X.str.len()

其中正则表达式查找重复2次的任何内容的完全匹配（\1指正则表达式中的第一个捕获组）

>>> df

          Names  Scores       X  N
0      JakeJake      70    Jake  4
1  ThomasThomas      81  Thomas  6
2    HarryHarry      23   Harry  5

网友

3楼 · 编辑于 2024-09-30 20:26:51

您可以在列Names上使用^{}，如下所示：

df['X'] = df['Names'].map(lambda x: x[:len(x)//2])

结果：

print(df)

          Names  Scores       X
0      JakeJake      70    Jake
1  ThomasThomas      81  Thomas
2    HarryHarry      23   Harry

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas保留前n个字符，其中n在列n中定义

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >