我有825468行的数据框。 我在上面表演。在
frame = frame.drop(frame.loc[(
frame['RR'].str.contains(r"^([23])[^-]*-\1[^-]*$")), 'RR'].str.replace("[23]([^-]*)-[23]([^-]*)", r"\1-\2").isin(
series1.str.replace("1([^-]*)-1([^-]*)", r"\1-\2"))[lambda d: d].index)
在哪里
^{pr2}$那么它能做什么呢
准备一个序列,其中RR
具有类似于1abc-1bcd
的值,然后如果在帧中有一个RR
类似{
但它给人记忆错误。是有一种更有效的方法来执行同样的操作。在
例如
如果在测向。。在
RR
0 2abc-2abc
1 1abc-1abc
2 3abc-3abc
3 2def-2def
4 3def-3def
5 def-dfd
6 sdsd-sdsd
7 1def-1def
那么从这个帧中2abc-2abc
和{1abc-1abc
中删除{2def-2def
不应该被删除,因为没有{
输出:
RR
0 1abc-1abc
1 def-dfd
2 sdsd-sdsd
3 1def-1def
更新2:
更新:
^{pr2}$注意:我特意添加了8
th
行:abc-abc
,不应删除(如果我正确理解您的问题)溶液1:使用
.str.replace()
和drop_duplicates()
方法:解决方案2:使用
.str.replace()
和.str.contains()
方法和布尔索引:注意:您可能需要用另一个符号来替换
'_'
,这在RR
列中永远不会出现相关问题 更多 >
编程相关推荐