如何比较相似的文本文件并输出重复项？

2条回答

网友

1楼 · 编辑于 2024-09-27 07:31:20

使用python，只需使用in关键字即可检查字符串是否包含在另一个字符串中：

str2 in str1

所以你可以这样做：

lines1 = list()
lines2 = list()

with open('file1.txt', 'r') as f1:
    for l1 in f1:
        lines1.append(l1.strip())

with open('file2.txt', 'r') as f2:
    for l2 in f2:
        lines2.append(l2.strip())

with open('output.txt', 'w') as out:
    for elt in [l1 for l2 in lines2 for l1 in lines1 if l2 in l1]:
        out.write('{}\n'.format(elt))

最重要的部分是：

[l1 for l2 in lines2 for l1 in lines1 if l2 in l1]

这意味着您要创建一个新的l1（文件1.txt中的文本行）列表，如果此l1中包含任何l2（文件2.txt中的文本行）

网友

2楼 · 编辑于 2024-09-27 07:31:20

我的第一个想法是使用.split(":")并将每个拆分的字符串放入每行的数组中，然后对于您给出的示例，只比较列表的前两个索引。对于文件的每一行，伪代码可能如下所示：

stringArray = fullStringFromFile1.split(":")
stringArray2 = fullStringFromFile2.split(":")
for i in range(len(smallestStringArray)):
    if stringArray[i] == stringArray2[i]:
         duplicateStringList.append(stringArray[i])

希望这能帮你找到正确的方向

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何比较相似的文本文件并输出重复项？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >