我有两个名为test1.csv
和test2.csv
的csv文件,它们都有一个名为“Name”的列。我想比较这两个文件之间的Name
列中的每一行,并输出与第三个文件不匹配的行。我见过一些使用熊猫的例子,但没有一个适合我的情况。有人能帮我写一个剧本吗
Test2将被更新,以包含test1中的所有值以及test1中未包含的新值(这些值是我希望保存到第三个文件中的值)
列的外观示例如下:
test1.csv:
Name Number Status
gfd454 456 Disposed
3v4fd 521 Disposed
th678iy 678 Disposed
test2.csv
Name Number Status
gfd454 456 Disposed
3v4fd 521 Disposed
th678iy 678 Disposed
vb556h 665 Disposed
见下文
其思想是将名称读入pythonset数据结构,并通过执行set子结构来查找新名称
1.csv:
2.csv
下面的代码将打印{'D','Z'},这是新名称
这应该是直截了当的-解决方案假设file2的内容相同或更长,因此项目仅附加到file2
如果项目的顺序是任意的,您可以使用
df.isin()
,如下所示:我创建了以下两个文件:
和file2.csv:
用于测试。数据帧
df
如下所示:我们只选择标记为
False
的项目此答案假设数据按示例中的方式排列:
相关问题 更多 >
编程相关推荐