如何选择数据集的第一列?

2024-09-28 17:24:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试获取数据集的第一列,以计算数据的汇总,如均值、中位数、方差、标准差等

这是我读取csv文件的方式

wine_data = pd.read_csv('winequality-white.csv')

我试着用两种方式选择第一列

first_col = wine_data[wine_data.columns[0]]
wine_data.iloc[:,0]

但我得到了整个结果

0        7;0.27;0.36;20.7;0.045;45;170;1.001;3;0.45;8.8;6
1       6.3;0.3;0.34;1.6;0.049;14;132;0.994;3.3;0.49;9...
2       8.1;0.28;0.4;6.9;0.05;30;97;0.9951;3.26;0.44;1...

4896    5.5;0.29;0.3;1.1;0.022;20;110;0.98869;3.34;0.3...
4897    6;0.21;0.38;0.8;0.02;22;98;0.98941;3.26;0.32;1...
Name: fixed acidity;"volatile acidity";"citric acid";"residual sugar";"chlorides";"free sulfur dioxide";"total sulfur dioxide";"density";"pH";"sulphates";"alcohol";"quality", Length: 4898, dtype: object

如何选择第一列,例如7,6.3,8.1,5.5,6.0


Tags: 文件csv数据data方式均值pd汇总
2条回答

您可以尝试以下方法:

first_col = wind_data.ix[:,0]

您可以使用以下选项:

#to see all columns
df.columns 
#Selecting one column
df['column_name']
#Selecting multiple columns
df[['column_one', 'column_two','column_four', 'column_seven']]

类似于此示例: example

或者,如果愿意,可以使用df.iloc

相关问题 更多 >