我正在读大pickle文件到pandas dataframe,我加载了其中一个,它是以我需要的方式加载的。但是,我有一个文件夹,有40个pickle文件,名为imdbnames0.pkl,imdbnames1.pkl,imdbnames2.pkl,…,imdbnames40.pkl。在
我希望以下面类似的方式加载它们,并将它们合并到sinlge pandas数据帧中。在
fh = open("ethnicity_files/imdbnames1.pkl", 'rb')
d = pickle.load(fh)
df = pd.concat({k:json_normalize(v, 'scores', ['best']) for k,v in d.items()})
df = df.reset_index(level=1, drop=True).rename_axis('names').reset_index()
df.head()
names ethnicity score best
0 !Gubi Tietie Asian 0.03 GreaterEuropean
1 !Gubi Tietie GreaterAfrican 0.01 GreaterEuropean
2 !Gubi Tietie GreaterEuropean 0.96 GreaterEuropean
3 !Gubi Tietie British 0.17 WestEuropean
4 !Gubi Tietie Jewish 0.13 WestEuropean
5 !Gubi Tietie WestEuropean 0.65 WestEuropean
6 !Gubi Tietie EastEuropean 0.05 WestEuropean
7 !Gubi Tietie Nordic 0.00 Italian
8 !Gubi Tietie Italian 0.69 Italian
9 !Gubi Tietie Hispanic 0.12 Italian
10 !Gubi Tietie French 0.16 Italian
11 !Gubi Tietie Germanic 0.02 Italian
12 $2 Tony Asian 0.00 GreaterEuropean
13 $2 Tony GreaterAfrican 0.00 GreaterEuropean
14 $2 Tony GreaterEuropean 1.00 GreaterEuropean
15 $2 Tony British 0.00 WestEuropean
16 $2 Tony Jewish 0.00 WestEuropean
17 $2 Tony WestEuropean 1.00 WestEuropean
18 $2 Tony EastEuropean 0.00 WestEuropean
19 $2 Tony Nordic 0.00 Italian
一个文件是https://drive.google.com/file/d/10cjsoWFJ46w-2lEsxh6hmuRZlLunatf-/view?usp=sharing。在
我只想在一个pandas数据框中添加它们。在
您可以使用
glob.glob
迭代当前文件夹中具有特定扩展名(.pkl)的所有文件我想你需要
os.listdir()
:相关问题 更多 >
编程相关推荐