我有一个大的文本文件,行如下:
data123||data456
data146||data269
data123||data456
data697||data983
data123||data456
我想在上面的例子中找到重复的行,比如data123 | | data456,打印这些行,然后删除文件中除了一个副本之外的所有行。我希望能够提取完全相同的行。在
到目前为止,我有以下代码,但是它似乎打印所有重复的“data###########################。换言之,我希望提取逐字重复的整行代码,而不仅仅是分离“data”。在
^{pr2}$
你把if语句颠倒过来了。你只想打印你以前没见过的线条,对吧?所以不是吗
试试这个:
获取文件行
根据这些台词找一套。重复项不包括在集合中
对于集合中的每一行,我们从原始列表中移除该行的一个实例
最后,集合包含非重复的,列表包含重复的(不被集合迭代的)实例。我们可以通过
请参见http://docs.python.org/2/tutorial/datastructures.html<;<;列表.删除(x) ,和“5.4套”
如果你的文件不是很大,这里有一个简单的方法:
duplicates
将包含在文件中多次出现的unique
的每个值的单个实例。在相关问题 更多 >
编程相关推荐