计算两个文件中公共集的数目

网友

1楼 · 编辑于 2024-10-16 20:41:16

解析文件，创建set行，每个元素按字典顺序排序。你知道吗

file1_sets = {tuple(sorted(line.split()[1:])) for line in open(file1, 'r')}
file2_sets = {tuple(sorted(line.split()[1:])) for line in open(file2, 'r')}

然后看看其中有多少存在于另一个

count = sum([f in file2_sets for f in file1_sets])

（根据评论编辑）

网友

2楼 · 编辑于 2024-10-16 20:41:16

请尝试以下python代码：

data1, data2 = [], []
for fname, data in [('file1.txt', data1), ('file2.txt', data2)]:
    for line in open(fname):
        data.append(set(line.strip().split()[1:]))

common = [s for s in data1 if s in data2]
for c in common:
    print c
print len(common)

输出：

set(['280', '251', '428'])
set(['309', '212', '226'])
set(['336', '339', '376'])
set(['380', '339', '376'])
set(['237', '418', '193'])
5

网友

3楼 · 编辑于 2024-10-16 20:41:16

使用集合和.intersection：

with open("21132195_1.txt") as fh1, open("21132195_2.txt") as fh2:
    number_sets1 = set(frozenset(line.split()[1:]) for line in fh1)
    number_sets2 = set(frozenset(line.split()[1:]) for line in fh2)

common_number_sets = number_sets1.intersection(number_sets2)

print "%i # no. of common sets" % len(common_number_sets)
print "\n".join([" ".join(s) for s in common_number_sets])

将作为输出：

5 # no. of common sets
339 376 380
251 280 428
212 226 309
193 237 418
336 339 376

相关问题更多 >

编程相关推荐

热门问题

热门文章

计算两个文件中公共集的数目

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >