我是文本挖掘新手,我正在使用Python。我有一个列表,每个列表包含同义词集群,集群中的每个单词都有一个列表,其中包含出现的句子数量。 我的清单是这样的
syn_cluster = [[['Jack', [1]]], [['small', [1, 2]], ['modest', [1, 3]], ['little', [2]]], [['big', [1]], ['large', [2]]]]
我希望为每个集群分配外观列表中的min
和max
,因此我希望结果如下
[[['Jack', [1]]], [['small', 'modest, 'little'], [1, 3]], [['big', large], [1, 2]]]
我不确定您是否使用了解决问题的最佳数据结构。但如果您使用列表列表执行此操作,您可以执行以下操作:
我想提出另一个解决办法
输出:
解释
您可以使用functools中的reduce函数来展开
syn_cluster
列表中的每个子列表将子列表展开后,可以使用理解列表来获取字符串元素
然后你可以用同样的逻辑得到数字列表
但是,此列表有以下方式:
[[1,2] [1,3,2], [1]]
,因此我再次使用了reduce
:之后,我们使用
min
和max
值创建列表,并验证numbers
列表的长度相关问题 更多 >
编程相关推荐