我是Python新手(在2.7中工作),我发现这是一个非常有价值的资源!在
假设我正在处理几个2元元组的列表,通常形式是(ID,value),例如
list1 = [(111, 222), (111, 333), (111, 444)]
list2 = [(555, 333), (555, 444), (555, 777)]
list3 = [(123, 444), (123, 888), (123, 999)]
我真正想做的是找到一个简单(并且计算效率高)的方法来得到这些元组的第二个元素的交集。我在Python docs中查看了一下,发现集合可以满足我的需要。。。this post有助于我理解如何得到两个列表的交集。在
我知道我可以通过这样的元组循环生成三个全新的“仅值”列表:
^{pr2}$然后得到每对的交集如下:
i_of_1and2 = set(newList1).intersection(newList2)
i_of_1and3 = set(newList2).intersection(newList3)
i_of_2and3 = set(newList1).intersection(newList3)
但是我的列表有点大——比如几十万(有时几千万)的元组。这真的是获得这三个列表元组中第二个元素的交集的最佳方法吗?在我看来…不雅观。在
谢谢你的帮助!在
首先,您将看到一个很大的问题
variable1
通常是一个错误的符号-如果您想要有多个值,请使用一个数据结构,而不是使用很多带有编号名称的变量。这可以阻止你一遍又一遍地重复你的代码,并有助于阻止错误。在让我们使用列表来代替:
现在我们只想得到子列表中每个元组的第二个元素。这很容易用list comprehension计算:
^{pr2}$然后,我们需要这些项之间的交集,我们使用^{} 得到两个可能的不同对:
所以,如果我们把这个放在一起:
这给了我们:
我在这里所做的更改是使内部列表成为集合理解,避免创建一个列表只是为了将其转换为集合,并且使用生成器表达式而不是列表理解,因为它的计算是惰性的。在
最后一点,如果您想要我们用来生成交集的列表的索引,那么使用the ^{} builtin 很简单:
这给了我们:
编辑:
与noted by tonyl7126一样,这也是一个可以通过使用更好的数据结构得到极大帮助的问题。这里最好的选择是使用一组产品id的dict。当你只需要一个集合,并打算稍后将其转换为集合时,没有理由将数据存储为一个列表,而dict对于你试图存储的数据类型是一个更好的解决方案。在
请参见以下示例:
给我们:
您可以利用^{} 方法获取2个或多个集合并找到它们的交集这一事实。另外,您可以使用list comprehensions来减少代码膨胀。最后,您可以使用argument list unpacking使其成为一行程序。例如:
为了帮助您理解发生了什么,对
^{pr2}$set.intersection(...)
的调用等效于以下python代码:我不确定您是否已经阅读过python中的词典,但这似乎适合您在结合列表时所做的工作。字典是由键和值组成的,就像你用2个元素元组模拟的一样。在
例如,list1、list2和list3可以表示为如下所示的字典(假设111是id): 你的字典={“111”:[222333,444],“555”:[333444777],“123”:[444888999]}
所以,如果你想得到一个特定id的所有值,比如“111”,你可以写下: 你的_dict.获取(“111”) 然后返回列表。这里是一些词典的链接。 http://docs.python.org/library/stdtypes.html#typesmapping
相关问题 更多 >
编程相关推荐