索引不匹配的数据帧之间的掩蔽

cnv = {'gene': ['a','b','c'], 'cell_1': [0,-1,0], 'cell_2': [0,-1,-1], 'cell_3': [-1,0,-1], 'cell_4': [-1,0,-1], 'cell_5': [-1,0,0] } cnvdf = pd.DataFrame(cnv) cnvdf.set_index('gene', inplace=True) cnv_mask = cnvdf < 0 rna = {'gene': ['x','y','z'], 'cell_1': [1, 5, 8], 'cell_2': [8, 5, 4], 'cell_3': [8, 6, 1], 'cell_4': [1, 2, 7], 'cell_5': [5, 7, 9], } rnadf_all = pd.DataFrame(rna) rnadf_all.set_index('gene', inplace=True)

print(rnadf) cell_1 cell_2 cell_3 cell_4 cell_5 gene x 1 8 8 1 5 y 5 5 6 2 7 z 8 4 1 7 9 print(cnv_mask) cell_1 cell_2 cell_3 cell_4 cell_5 gene a False False True True True b True True False False False c False True True True False

for rR in rnadf_all.iterrows(): for cR in cnv_mask.iterrows(): link = rR+"&"+cR rnaPos = rR[<True values from cR mask applied to rR>].dropna() rnaNeg = rR[<False values from cR mask applied to rR>].dropna() t, p = stats.ttest_ind(rnaPos, rnaNeg)

1条回答

网友
1楼 · 发布于 2024-10-02 20:40:31

import itertools for pr in itertools.product(rnadf_all.index, cnv_mask.index): print('&'.join(pr), rnadf_all.loc[pr[0]][cnv_mask.loc[pr[1]]].tolist(), rnadf_all.loc[pr[0]][~cnv_mask.loc[pr[1]]].tolist()) x&a [8, 1, 5] [1, 8] x&b [1, 8] [8, 1, 5] x&c [8, 8, 1] [1, 5] y&a [6, 2, 7] [5, 5] y&b [5, 5] [6, 2, 7] y&c [5, 6, 2] [5, 7] z&a [1, 7, 9] [8, 4] z&b [8, 4] [1, 7, 9] z&c [4, 1, 7] [8, 9]
你知道吗itertools.产品提供所有可能的产品。对于它们中的每一个，rnadf_all.loc[pr[0]][cnv_mask.loc[pr[1]]].tolist()转到rnadf_all中相应的行，并根据cnv_mask中相应行的真值对其进行切片。对于假值，只需要在cnv_mask前面加一个波浪号。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章