通过技术和工厂管理总结CSV电厂数据

2024-05-18 17:43:17 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个关于美国发电厂的问题。你知道吗

它是按块组织的,而不是按植物组织的。为了变得有用,必须将容量数字相加。你知道吗

我如何获得每个工厂每项技术的总产能(按名称或id)?你知道吗

Plant ID,Plant Name,Nameplate Capacity (MW),Technology,...
3,Barry,153.1,Natural Gas Steam Turbine,..
3,Barry,153.1,Natural Gas Steam Turbine,..
3,Barry,403.7,Conventional Steam Coal,..
3,Barry,788.8,Conventional Steam Coal,..
3,Barry,195.2,Natural Gas Fired Combined Cycle,..
3,Barry,195.2,Natural Gas Fired Combined Cycle,..
10,Greene County,299.2,Natural Gas Steam Turbine,..
10,Greene County,269.2,Natural Gas Steam Turbine,..
10,Greene County,80,Natural Gas Fired Combustion Turbine,..
10,Greene County,80,Natural Gas Fired Combustion Turbine,..
10,Greene County,80,Natural Gas Fired Combustion Turbine,..

只有用Calc或Excel中的SUMIF进行总结是很容易做到的,但是如何通过技术进行过滤呢? 所以我最好用纯CSV处理。你知道吗

例如Python,这可能吗?谢谢你的回答!你知道吗


Tags: natural技术steamgasplantcombinedcyclecounty
2条回答

熊猫图书馆将是一个有用的图书馆。它用于处理数据帧。你知道吗

导入熊猫库

import pandas as pd

读取表单csv文件

df = pd.read_csv("form.csv")

求和

df.groupby('PlantName')['NameplateCapacity'].sum()

使用Python,您可以使用第三方库:

将Excel文件读入数据框

import pandas as pd

df = pd.read_excel('file_in.xlsx')

用sum计算GroupBy

Grouper键可以是标量或列表。例如,它们都是有效的:

res = df.groupby('Technology')['Capacity'].sum().reset_index()
res = df.groupby(['ID', 'Name'])['Capacity'].sum().reset_index()

我们使用reset_index返回一个数据帧。你知道吗

导出回Excel

res.to_excel('file_out.xlsx')

相关问题 更多 >

    热门问题