我根据一起旅行的百分比对一起旅行的旅行者进行分组。这似乎类似于另一个问题(Group Python list of lists into groups based on overlapping items),但条件不同
如果旅行者一起旅行了80%的行程,那么他们将分组在一起。如果同一个旅行者在不同的群体中,这是可以的
数据:(实际数据集很大,有>;1000次旅行和旅行者)
Traveller Trips
A [Trip_1, Trip_2, Trip_3, Trip_4, Trip_5]
B [Trip_1, Trip_2, Trip_3, Trip_4]
C [Trip_6, Trip_7]
D [Trip_8]
E [Trip_2, Trip_3, Trip_4, Trip_5]
F [Trip_2, Trip_3, Trip_4, Trip_5]
G [Trip_8]
预期产出:
TravelGroup Traveller
Group_1 A
Group_1 B
Group_2 A
Group_2 E
Group_2 F
Group_3 C
Group_4 D
Group_4 G
注意A和B在一个组中;A、 E和F是一组。 然而,B和C不在同一组中,因为他们在旅行中只有75%的匹配
非常感谢您的帮助,非常感谢
印刷品:
相关问题 更多 >
编程相关推荐