在来自另一个df的子集的中间值上填充df列

df1=pd.DataFrame(columns=['qb','qb_median']) df1.qb=['qb1','qb2'] df1 Out[76]: qb qb_median 0 qb1 NaN 1 qb2 NaN df2=pd.DataFrame({'sample':['A','B','C','D','E','F'],'x':[1,2,3,4,5,6]}) df2 Out[78]: sample x 0 A 1 1 B 2 2 C 3 3 D 4 4 E 5 5 F 6 sets={'qb1':['A','B','C'],'qb2':['D','E','F']}

2条回答

网友

1楼 · 编辑于 2024-09-28 21:57:59

如何创建一个新列，使用掩码来了解列的值然后使用groupby？第一部分仍然有点荒谬，但是获得平均值的groupby更像python

df2['qbgroup'] = ''
df2.loc[((df2['sample']=='A') | (df2['sample']=='B') | (df2['sample']=='C')), 'qbgroup'] = 'qb1'
df2.loc[((df2['sample']=='D') | (df2['sample']=='E') | (df2['sample']=='F')), 'qbgroup'] = 'qb2'
foo = df2.groupby(df2['qbgroup']).mean()

网友

2楼 · 编辑于 2024-09-28 21:57:59

您可以尝试以下方法，希望对您有所帮助

df1.set_index('qb',inplace=True)

for qb in df1.index.values:
    qb_median = df2[df2['sample'].isin(sets[qb])]['x'].median()
    df1['qb_median'][qb] = qb_median

相关问题更多 >

编程相关推荐

热门问题

热门文章

在来自另一个df的子集的中间值上填充df列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >