我需要处理来自大数据csv的地理和统计数据。它包含来自地理管理和地理统计的数据。城市、地理位置、地质统计学基本分区和区块构成了层次性指标。在
我必须为每个元素创建一个新的列['data2'],即地理索引中数据的最大值,并将每个块值除以该值。对于每个索引级别,并且索引级别值必须与0不同,因为0索引级别值将说明计算中未使用的其他类型的信息。在
data1 data2
mun loc geo block
1 0 0 0 20 20
1 1 0 0 10 10
1 1 1 0 10 10
1 1 1 1 3 3/4
1 1 1 2 4 4/4
1 1 2 0 30 30
1 1 2 1 1 1/3
1 1 2 2 3 3/3
1 2 1 1 10 10/12
1 2 1 2 12 12/12
2 1 1 1 123 123/123
2 1 1 2 7 7/123
2 1 2 1 6 6/6
2 1 2 2 1 1/6
有什么想法吗?我尝试过for循环,使用reset_index()转换列中的索引,并按列和行值迭代,但计算要花很多时间,我认为这不是执行此类操作的正确方法。在
还有,如果我想得到这样的面具,这样我就可以在每个层面上运行计算了。在
^{pr2}$
您可以首先从^{} 创建{},与} 检查至少一个{}(至少一个{}):
0
进行比较,然后通过^{然后根据第一个、第二个和第三个索引按^{} 获得^{} 值,但在按^{} 过滤之前,仅在}的值:
^{pr2}$mask
中没有{然后^{} }的最后一级,按^{} 删除{}的最后一级,^{} 值不受},因为除以返回相同的值。在
df1
按df.index
删除{mask
(也有必要删除最后一级)和{a9}除以{最后除以^{} :
相关问题 更多 >
编程相关推荐