我有一个名为dfDays的数据帧,如下所示:
siren Groupe nomination_frequence demission_frequence depart_frequence modification_frequence deces_frequence confirmation_frequence sansprecision_frequence nbJoursMoyenne ecart_type nbJoursDernierEvenementExtraction
0 XXX Dirigeants 1 0 0 0 0 0 0 None NaN 2345
1 XXX Autres 2 0 2 0 0 0 0 191 270.586 1217
2 XXX Dirigeants 0 0 0 0 0 0 3 281 281 1283
3 XXX Dirigeants 2 2 0 0 0 0 0 61 86.7384 1583
4 XXX Dirigeants 1 1 0 0 0 0 5 93 136.118 1283
我在一个名为dfNew的新datadrame中添加了dfDays的值,但是根据“groupe”添加了一个类别
假设我想要获得的最终数据帧是:(不要看这些值)
^{pr2}$我的代码如下:
liste_nom = ['nomination_frequence','demission_frequence','depart_frequence','modification_frequence','deces_frequence','confirmation_frequence','sansprecision_frequence',
'nbJoursMoyenne','ecart_type', 'nbJoursDernierEvenementExtraction']
for index, row in dfDays.iterrows():
#print(row)
name = row['Groupe']
siren = row['siren']
index = dfRight[dfRight['siren'] == siren].index[0]
print(dfNew.columns)
for value in liste_nom:
#print(row)
#print(row[value])
dfNew.loc[index, name + '_' + value] = row[value]
print(dfNew.columns)
我的问题是,在使用first.loc和index之前,我的列在dfNew中如下所示:
Index(['siren', 'Dirigeants_nomination_frequence',
'Dirigeants_demission_frequence', 'Dirigeants_depart_frequence',
'Dirigeants_modification_frequence', 'Dirigeants_deces_frequence',
'Dirigeants_confirmation_frequence',
'Dirigeants_sansprecision_frequence',
'MembresDuConseil_nomination_frequence',
'MembresDuConseil_demission_frequence',
'MembresDuConseil_depart_frequence',
'MembresDuConseil_modification_frequence',
'MembresDuConseil_deces_frequence',
'MembresDuConseil_confirmation_frequence',
'MembresDuConseil_sansprecision_frequence',
'Autres_nomination_frequence', 'Autres_demission_frequence',
'Autres_depart_frequence', 'Autres_modification_frequence',
'Autres_deces_frequence', 'Autres_confirmation_frequence',
'Autres_sansprecision_frequence', 'mouvements_nbJoursMoyenne',
'mouvement_ecart_type'],
dtype='object')
但在多次使用.loc之后,列被交换,如下所示:
Index(['siren', 'Dirigeants_nomination_frequence',
'Dirigeants_demission_frequence', 'Dirigeants_depart_frequence',
'Dirigeants_modification_frequence', 'Dirigeants_deces_frequence',
'Dirigeants_confirmation_frequence',
'Dirigeants_sansprecision_frequence',
'MembresDuConseil_nomination_frequence',
'MembresDuConseil_demission_frequence',
'MembresDuConseil_depart_frequence',
'MembresDuConseil_modification_frequence',
'MembresDuConseil_deces_frequence',
'MembresDuConseil_confirmation_frequence',
'MembresDuConseil_sansprecision_frequence',
'Autres_nomination_frequence', 'Autres_demission_frequence',
'Autres_depart_frequence', 'Autres_modification_frequence',
'Autres_deces_frequence', 'Autres_confirmation_frequence',
'Autres_sansprecision_frequence', 'mouvements_nbJoursMoyenne',
'mouvement_ecart_type', 'Dirigeants_nbJoursMoyenne',
'Dirigeants_ecart_type', 'Dirigeants_nbJoursDernierEvenementExtraction',
'Autres_nbJoursMoyenne', 'Autres_ecart_type',
'Autres_nbJoursDernierEvenementExtraction',
'MembresDuConseil_nbJoursMoyenne', 'MembresDuConseil_ecart_type',
'MembresDuConseil_nbJoursDernierEvenementExtraction'],
dtype='object')
我不明白.loc的用法如何能够交换列的顺序? 谢谢你的阅读。在
我想您需要^{} 来重塑形状,然后用}将列中的{}展平:
map
和{第一个按列表筛选列:
^{pr2}$但如果得到:
这意味着新索引和列的列对中存在重复项。在
因此需要^{} 和一些聚合函数,如
mean
:但如果需要通过交换和排序来更改列名称:
相关问题 更多 >
编程相关推荐