Python：导入列表的堆叠字典以创建多索引DataFram

{product_name : { column_title_1 :[val1,val2,val3], column_title_2 :["string 1","string 2","string 3"], column_title_3 :["string 1a","string 2b","string 3c"], "categories" :["category1","category1","category1"]}}}

--------------------------------column_title_1-----column_title_2-----column_title_3 product_name_1---category 1-----val_1 -----string 1 -----string 1a --------------------------------val_2 -----string 2 -----string 2b --------------------------------val_3 -----string 3 -----string 3c -----------------category 2-----val_4 -----string 4 -----string 4d --------------------------------val_5 -----string 5 -----string 5e --------------------------------val_6 -----string 6 -----string 6f product_name_2---category 1a----val_1 -----string 1 -----string 1a --------------------------------val_2 -----string 2 -----string 2b --------------------------------val_3 -----string 3 -----string 3c -----------------category 2b----val_4 -----string 4 -----string 4d --------------------------------val_5 -----string 5 -----string 5e --------------------------------val_6 -----string 6 -----string 6f

--------------------------------column_title_1-----column_title_2-----column_title_3------category product_name_1------------------val_1 -----string 1 -----string 1a ------category1 --------------------------------val_2 -----string 2 -----string 2b ------category1 --------------------------------val_3 -----string 3 -----string 3c ------category1 --------------------------------val_4 -----string 4 -----string 4d ------category2 --------------------------------val_5 -----string 5 -----string 5e ------category2 --------------------------------val_6 -----string 6 -----string 6f ------category2 product_name_2------------------val_1 -----string 1 -----string 1a ------category1a --------------------------------val_2 -----string 2 -----string 2b ------category1a --------------------------------val_3 -----string 3 -----string 3c ------category1a --------------------------------val_4 -----string 4 -----string 4d ------category1b --------------------------------val_5 -----string 5 -----string 5e ------category1b --------------------------------val_6 -----string 6 -----string 6f ------category1b

1条回答

网友

1楼 · 发布于 2024-10-01 09:27:44

据我所知，pandas.DataFrame.from_dict不生成多索引数据帧。另外，在您的例子中，一些字典键是索引，其他的是列，所以您需要自己构建dataframe。你知道吗

您可以使用内部嵌套级别的字典对字典进行迭代以生成数据帧列表，然后使用pandas.concat将它们连接到单个多索引数据帧中。你知道吗

让我们从结构2开始（ss2是结构2之后的字典），它更简单：

df_list2 = [pd.DataFrame(v, index=pd.MultiIndex.from_product([[k], range(len(v[list(v)[0]]))])) for k, v in ss2.items()]
df2 = pd.concat(df_list2)

df_list2是一个数据帧列表，对于每一个数据帧，multindex都已经使用pandas.MultiIndex.from_product准备好了，因此当使用concat时，结果会自然出现。MultiIndex有两个级别：产品名和具有相同产品名的行的递增整数。你知道吗

结构1的逻辑相同（这里ss1是字典`），但是这里的迭代更复杂，因为在多索引中有3个级别：产品名称、类别名称和渐进整数。你知道吗

df_list1 = [pd.DataFrame(iv, index=pd.MultiIndex.from_product([[k], [ik], range(len(iv[list(iv)[0]]))])) for k, v in ss1.items() for ik, iv in v.items()]
df1 = pd.concat(df_list1)

相关问题更多 >

编程相关推荐

热门问题

热门文章