在Python中使用Unstack

1条回答

网友

1楼 · 发布于 2024-10-04 13:26:11

在调用unstack之前，year需要创建一个索引，然后调用unstack:

try:
    # for Python2
    from cStringIO import StringIO 
except ImportError:
    # for Python3
    from io import StringIO

import pandas as pd


text = '''\
station_id   year     Day1   Day2 
 210018       1916      4        7
 210018       1917      3        9 
 256700       1916     NaN       8
 256700       1917      6        9'''

df = pd.read_table(StringIO(text), sep='\s+')
df = df.set_index(['station_id', 'year'])
df2 = df.unstack(level='year')
df2.columns = df2.columns.swaplevel(0,1)
df2 = df2.sort(axis=1)
print(df2)

收益率

^{pr2}$
然而，如果year是列，而不是索引，那么
df = pd.read_table(StringIO(text), sep='\s+') df = df.set_index(['station_id']) df2 = df.unstack(level='year') df2.columns = df2.columns.swaplevel(0,1) df2 = df2.sort(axis=1)
导致AttributeError: 'Series' object has no attribute 'columns'。在
当df没有名为year（或者甚至是blah）的索引级别时，level='year'在{}中被忽略：
In [102]: df Out[102]: year Day1 Day2 station_id 210018 1916 4 7 210018 1917 3 9 256700 1916 NaN 8 256700 1917 6 9 In [103]: df.unstack(level='blah') Out[103]: station_id year 210018 1916 210018 1917 256700 1916 256700 1917 Day1 210018 4 210018 3 256700 NaN 256700 6 Day2 210018 7 210018 9 256700 8 256700 9 dtype: float64
这就是这个令人惊讶的错误的来源。在

相关问题更多 >

编程相关推荐

热门问题

热门文章