获取第二个和第三个斜杠之间的值

2024-09-28 20:58:17 发布

您现在位置:Python中文网/ 问答频道 /正文

我是python新手,1。我尝试应用正则表达式,甚至提取Pandas数据帧列(所有行)的最后6位数字。在

基本上,我试图提取pandas列中第二个和第三个斜杠0000/00000/00/000之间的值。 我的函数用于提取pandas数据帧“data\u extract”的最后6位数字(列名为“extract”)是data_extracted=data_extract.extract.str[:-4]

在测向头()看起来像这样[![在此处输入图像说明][1]][1]

我正在尝试提取最后6位数字并存储在新列中,或者提取第2和第3斜杠“/”之间的数字并将其存储在pandas dataframe中的新列中。 正如Mohamed Thasin建议的,应用Lamba表达式[![在此处输入图像说明][2]][2] asdf['Numbers'].apply(lambda x: x.split('/'))通过基于“/”的拆分在数组中生成。如何获得数组的第二个索引?在


Tags: 数据函数图像dataframepandasdataextract数字
2条回答

这里的regex似乎可以得到第二个和第三个斜杠之间的任何内容。这个链接包含了我使用的所有语法的所有解释。在

^(?:[^\/]*\/){2}([^\/]*)\/.*$

除了第二个定界符(/)和第二个定界符(/)基本上与第二个定界符匹配

希望有帮助:)

试试这个

df['Numbers'].apply(lambda x: x.split('/')[2]), This splits the Dataframe (all rows) for every occurrence of '/' and then takes the value between 2nd and 3rd '/'.

如果包含意外格式

^{pr2}$

这是用于检查是否正常,如果拆分后列表不包含4个元素,则它将填充“”为空,而不是抛出超出绑定的索引错误。

相关问题 更多 >