这和这个问题很相似:Finding minimum, maximum and average values for nested lists?
这个问题的重要区别和根源是,我想找到列表(嵌套在列表中)中每个唯一列名(人名)的最小值、最大值、平均值。在
例如: 每一行基本上(用相似的假名)—
epochtime, name, score, level, extralives
例如
^{pr2}$这些都是按时间排列的:
if epochtime < 1234500 and epochtime > 1234400:
timechunk1.append(line)
每个时间段都有一个列表:
listoflists = [timechunk1, timechunk2....]
对于这个问题来说,这可能是也可能不是多余的/无关的。
对于每个唯一的名字(billy或suzy-除了billy或suzy-,我如何找到每个字段(score、level、extralifes)的最小值、最大值、平均值?在每个列表(timechunk1、timechunk2)中,不单独列出它们会更好吗?在
pandas示例:
或者简单地说:
^{pr2}$然后:
^{3}$等等。如果你用R/SQL的方式思考,但又想使用Python,那么一定要试试pandas。在
请注意,您还可以执行多列分组:
你必须收集每个名字,每个领域的列表。在
将
collections.defaultdict
与工厂一起使用来创建嵌套列表:将示例输入数据转储到一个timechunk中可以得到:
^{pr2}$也许您应该考虑使用不同的数据结构而不是所有这些列表,或者使用类似于pandas的方法来帮助您更有效地分析数据。在
相关问题 更多 >
编程相关推荐