我是python新手,1。我尝试应用正则表达式,甚至提取Pandas数据帧列(所有行)的最后6位数字。在
基本上,我试图提取pandas列中第二个和第三个斜杠0000/00000/00/000之间的值。
我的函数用于提取pandas数据帧“data\u extract”的最后6位数字(列名为“extract”)是data_extracted=data_extract.extract.str[:-4]
在测向头()看起来像这样[![在此处输入图像说明][1]][1]
我正在尝试提取最后6位数字并存储在新列中,或者提取第2和第3斜杠“/”之间的数字并将其存储在pandas dataframe中的新列中。
正如Mohamed Thasin建议的,应用Lamba表达式[![在此处输入图像说明][2]][2]
asdf['Numbers'].apply(lambda x: x.split('/'))
通过基于“/”的拆分在数组中生成。如何获得数组的第二个索引?在
这里的regex似乎可以得到第二个和第三个斜杠之间的任何内容。这个链接包含了我使用的所有语法的所有解释。在
除了第二个定界符(/)和第二个定界符(/)基本上与第二个定界符匹配
希望有帮助:)
试试这个
如果包含意外格式
^{pr2}$这是用于检查是否正常,如果拆分后列表不包含4个元素,则它将填充“”为空,而不是抛出超出绑定的索引错误。
相关问题 更多 >
编程相关推荐