我有一个平面的CSV文件,里面有这样的数据:
tag1,pageA
tag2,pageA
tag3,pageA
tag1,pageB
tag4,pageB
tag5,pageC
tag5,pageD
tag4,pageE
tag6,pageE
我想以某种方式将pages
划分为相互排斥的组,这取决于它们直接或通过关联共享的所有tags
。你知道吗
换句话说,我想回答的问题是:
例如,除非我计算错误,否则上述示例数据有两组:
Group 1:
(tag1,tag2,tag3,tag4,tag6) ==>
(pageA,pageB,pageE)
Group 2:
(tag5) ==>
(pageC,pageD)
获得这些分组的合理方法是什么?我对使用Python和/或sqlite持开放态度。你知道吗
['pageA','pageB','pageE']
['pageC','pageD']
相关问题 更多 >
编程相关推荐