我有四份名单,长度约20万。第一个列表包含1到24之间的小时值,下面是一个示例
Hour_list = [1,2,2,2,5,5,7,5,12,18,24,.....]
avg_occupancy = [0,5,9,5,13,24,56,23,.....]
avg_absences = [0,4,5,7,8,6,8,3,2,1.....]
Room_config= ['config_a001', 'configa002', 'configa003', 'configa004', 'configa005'.........]
我需要为每个小时创建24个列表,list\u hour1、list\u Hour2等等,然后根据它们过滤其他三个列表,例如,list\u Hour2应该包含数字2,avg\u ocupancy\u hour\u 2应该包含索引与第一个列表中数字2的索引相对应的所有项目,这意味着avg\u ocupancy\u hour\u 2=[5,9,5,…],平均缺勤率2=[4,5,7,…],房间配置=['configa002','configa003','configa004','configa005'…]
我认为Zip会很好,但不知道如何利用它在这种情况下
是的,这就像。。这就是为什么数据帧是一种东西。你知道吗
把它们放在熊猫身上:
将他们分组:
现在你可以做任何事情-你可以计算汇总数据,或者只是遍历所有的时间:
对于您的后续问题,您可以采取以下方法进行计算:
然后,您可以通过
.loc
和逻辑测试选择索引为9(即9小时)的行。你知道吗, :
部分告诉pandas返回满足mean_data.index == 9
测试的任何行的所有列。你知道吗使用
zip
和defaultdict
(以及清洁度类):从集合导入defaultdict
产生:
我向您介绍了以下代码;它基于随机数据并使用熊猫库,也将给您带来更大的灵活性:
相关问题 更多 >
编程相关推荐