我在Python中面临一个问题。 我有一个数据帧,我只想得到不同列的可能性。 例如,我有:
import pandas as pd
df = pd.DataFrame({
'name':['Dupont','Dupant','Darang','BA','Scatt','Sieb'],
'ID': ['789985','789852','9852220','015220','015221','10022']
})
我想知道如何处理此数据帧以获得以下结果:
df = pd.DataFrame({
'name':['Dupont','Dupant','BA','Scatt'],
'ID': ['789985','789852','015220','015221']
})
df
如有任何意见或建议,将不胜感激
我试过一些东西,但很复杂。改变字母组合的可能性是“无止境的”(好吧,它基本上不是无止境的,而是n!,这是很多)。我设法将其作为条件:
这是我的代码认为的可能性的组合:
我似乎无法理解编写if语句的逻辑:
关于你的声明:
我所需要的就是返回看起来相同的数据,即使添加或删除了一个字符,或者不遵守顺序
这并不像你想象的那么简单,事实上,这很复杂。 有很多假设我们没有讨论,举一些例子:
这些是我的代码中未包含的一些示例(将被过滤掉,不会被视为类似条目)
话虽如此,这是我的代码:
print
命令给出的输出是:并给出一些注释:
name
:Dupont and Dupant
被认为是相同的ID
列:789985 and 789852
,015220 and 015221
被认为是相同的如果我同意这一说法:
我所需要的就是返回看起来相同的数据,即使添加或删除了一个字符,或者不遵守顺序
然后,带有
ID
:10022
的第5行应被视为与015220
相同,因为015220
>10022
:缺少一个字符,不遵守顺序所有的事情,所有的,这种条件作用是非常复杂的。我确信我的代码遗漏了很多东西
相关问题 更多 >
编程相关推荐