使用variab存储分组数据

网友

1楼 · 编辑于 2024-05-19 21:38:08

你可以试试

d.groupby('Park')['Location'].nunique()

网友

2楼 · 编辑于 2024-05-19 21:38:08

小心使用Panda的DataFrame函数，它是否会产生内联更改。例如，d[d['Park']=='AKRO']实际上并没有改变数据帧d。但是，x = d[d['Park']=='AKRO']将d[d['Park']=='AKRO']的输出设置为x，因此x现在只有一个位置。你知道吗

您是否手动检查过“AKRO”有多少唯一的位置标识？for循环在y= len(x['Location'].unique())周围的额外括号外看起来是正确的

网友

3楼 · 编辑于 2024-05-19 21:38:08

当您第一次使用子集时，您没有将d[d['Park'] == 'ARKO']赋值给任何对象。所以你并没有改变数据。你只查看了那部分数据。你知道吗

当您分配x = d[d['Park']=='AKRO']时，x现在只是您用第一个命令查看的部分。这就是为什么你得到了你所观察到的差异。你知道吗

for循环实际上只在d的列中循环。如果您希望循环浏览这些行，可以使用以下命令。你知道吗

for idx, row in d.iterrows():
    print(idx, row)

然而，如果你想用for循环来计算地点的数量，你必须在每个公园中循环。像下面这样。你知道吗

for park in d['Park'].unique():
    print(park, d.loc[d['Park'] == park, 'Location'].size())

但是，您可以不用迭代就完成您的目标。最好采用这种方法。你知道吗

d.groupby('Park')['Location'].nunique()