我是pandas的新手,我在编写基于自定义条件添加新列的函数时遇到问题: 以下是我的数据帧:
c1 c2 c3 c4 c5
0 1234 888 36.12733265 -115.1710473 7048929337
1 2341 70 33.62503113 -111.928576 7048929337
2 8910 419 40.734631 -73.8700321 9192939495
3 8910 910 40.734631 -73.8700321 9192939495
4 5678 1295 40.719729 -73.84412 5109400188
5 3345 4976 33.5350596 -112.2670918 9192939495
6 233345 2364 33.5350596 -112.2670918 4806391796
7 3010 1155 42.8254528 -71.5012724 2393900772
8 3010 6800 41.0488534 -75.313324 8434975913
9 4534 1791 42.955875 -76.92238325 9048190206
10 7658 4711 40.7635948 -73.3066489 6312542029
11 7658 9120 34.8465348 -117.0854289 6312542029
我想添加一个名为dup的新列,它包含指示该行是否重复(就特定列而言是重复的)的标志。 优先顺序如下:
1.)如果行在c3和c4方面都是重复的,则标志应该是dup_c3c4
2.)否则,如果行与c5重复,则标志应为dup_c5
3.)否则,如果行在c1中是重复的,则标志应该是dup_c1
4.)else标志应该是NaD(不是重复的)。在
预期产量:
^{pr2}$有谁能建议我如何使用if-else或其他有效的方式为这个场景编写一个自定义函数吗。在
将^{} 与^{} 一起用于3种不同的条件:
如果需要功能:
^{pr2}$相关问题 更多 >
编程相关推荐