将字符串替换为数据帧中由大写字母分隔的字符串列表

2024-05-17 21:09:16 发布

您现在位置:Python中文网/ 问答频道 /正文

数据

  Metropolitan area Population (2016 est.)[8]                     NHL
0          New York                  20153634  RangersIslandersDevils
1       Los Angeles                  13310447              KingsDucks
2          San Jose                   6657982                  Sharks
3           Chicago                   9512999              Blackhawks

我希望输出为:

  Metropolitan area Population (2016 est.)[8]                     NHL
0          New York                  20153634  ['Rangers','Islanders','Devils']
1       Los Angeles                  13310447              ['Kings','Ducks']
2          San Jose                   6657982                  Sharks
3           Chicago                   9512999              Blackhawks

我希望这些字符串在列表中,以便以后可以使用explode()。请帮忙


Tags: 数据newareaestpopulationsannhlyork
1条回答
网友
1楼 · 发布于 2024-05-17 21:09:16

您可以使用具有正向前瞻性的正则表达式split

df['NHL'].str.split('[a-z](?=[A-Z])')

输出:

0    [Ranger, Islander, Devils]
1                 [King, Ducks]
2                      [Sharks]
3                  [Blackhawks]

模式'[a-z](?=[A-Z])'查找所有小写字母,后跟大写字母

相关问题 更多 >