如何通过在python中过滤另一列来计算列的平均值?

2024-10-02 04:35:19 发布

您现在位置:Python中文网/ 问答频道 /正文

我有档案汽车.csv包括汽车的详细信息,品牌和售价。我使用python分析其中的数据。文件中有许多列。文件中有两列是价格和品牌。品牌有大众、福特、雷诺等。我想选择一个特定的品牌,并计算出该品牌的平均价格。如何使用Pandas在python中实现这一点?在

以下是数据截图 https://prnt.sc/l80lf0


Tags: 文件csv数据httpspandas详细信息价格档案
2条回答

相反,使用csv使用pandas,这是专门为此构建的,处理能力很好。在

import pandas as pd
data = pd.read_csv('my.csv')

则大众汽车列的平均值:

^{pr2}$

如果您正在寻找特定的brand

df.groupby(['brand] == 'volkswagen')['price'].mean()

不使用第三方库,您可以这样做:

import csv
import numpy

nums = []
with open('test.csv','rb') as f:
    reader = csv.reader(f,delimiter=',')
    for row in reader:
        if row[0] == "bmw":
            nums.append(int(row[1]))

numpy.mean(nums)

您应该为行的索引放置正确的值。 如果你想计算所有品牌的平均值,你可以使用字典来保存每个品牌的价格数组。在

相关问题 更多 >

    热门问题