我有以下数据文件LawSchoolSample.csv
:
LSAT,GPA
622,3.23
542,2.83
579,3.24
653,3.12
606,3.09
我想创建一个pandas数据帧,然后从这个数据帧重新采样B
次以形成一个pandas面板。以下是我的尝试(欢迎评论):
import pandas as pd
df = pd.read_csv("LawSchoolSample.csv")
B = 3
resamples = {}
for i in range(0,B):
name = "Resample {}".format(i)
resamples[name] = df.sample(5,replace=True)
print resamples
resamples_panel = pd.Panel(resamples)
除了最后一行:resamples_panel = pd.Panel(resamples)
一切正常。错误是:
pandas.core.index.InvalidIndexError: Reindexing only valid with uniquely valued Index objects
我有两个问题:
panel
值得吗?或者是任何数据结构resamples
都足够好吗?你知道吗dataframes
的首选方法是什么?你知道吗
长期计划是反对
Panel
,见熊猫文档:http://pandas.pydata.org/pandas-docs/version/0.18.0/whatsnew.html#to-xarray
相关问题 更多 >
编程相关推荐