使用掩码和错误/不兼容在数据帧中进行类型转换

id super_graph sub_graph GO1 GO1 ['GO4', 'GO5', 'GO6', 'GO7', 'GO8', 'GO9'] GO9 GO2 GO2 ['GO4', 'GO5', 'GO6', 'GO7', 'GO8', 'GO9'] GO11 GO3 GO3 ['GO1', 'GO5', 'GO6', 'GO7', 'GO8', 'GO9'] GO12 GO4 GO4 ['GO1', 'GO6', 'GO7'] GO5 GO5 ['GO5'] GO6 GO6 ['GO1', 'GO5', 'GO7', 'GO3', 'GO9'] GO7 GO7 ['GO2', 'GO5', 'GO6', 'GO7', 'GO8', 'GO10', 'GO11', 'GO12'] GO8 GO8 ['GO2', 'GO3', 'GO4', 'GO5', 'GO6', 'GO7', 'GO8', 'GO9'] GO9 GO9

initial_frame = count_frame.loc[:,['id', "super_graph", "sub_graph"]]#THE FRAME WHOSE EXAMPLE YOU HAVE ABOVE initial_frame_mask = ~initial_frame.applymap(lambda cell: isinstance(cell, list)| (cell is None)) list_frame = initial_frame.mask(initial_frame_mask,initial_frame.applymap(lambda l: [l])) list_frame2 = list_frame.applymap(lambda l: set(l) if l is not None else {})

initial_frame = count_frame.loc[:,['id', "super_graph", "sub_graph"]] initial_frame_mask = ~initial_frame.applymap(lambda cell: isinstance(cell, list)) list_frame = initial_frame.mask(initial_frame_mask,initial_frame.applymap(lambda l: {l}) if l is not None else {})

id super_graph sub_graph GO1 True False True GO2 True False True GO3 True False True GO4 True False False GO5 True False False GO6 True False False GO7 True False False GO8 True False False GO9 True False False

id super_graph sub_graph GO1 {GO1} {nan} {GO9} GO2 {GO2} {nan} {GO11} GO3 {GO3} {nan} {GO12} GO4 {GO4} {nan} {nan} GO5 {GO5} {nan} {nan} GO6 {GO6} {nan} {nan} GO7 {GO7} {nan} {nan} GO8 {GO8} {nan} {nan} GO9 {GO9} {nan} {nan}

count_frame = pd.DataFrame([["GO2","GO3","GO4","GO5","GO6","GO7","GO8","GO9"],\ [["GO4", "GO5","GO6","GO7","GO8","GO9"], ["GO4", "GO5","GO6","GO7","GO8","GO9"], ["GO1", "GO5","GO6","GO7","GO8","GO9"], ["GO1", "GO6","GO7"], ["GO5"] ["GO1", "GO5","GO7","GO3","GO9"], ["GO2", "GO5","GO6","GO7","GO8","GO10","GO11", "GO12"], ["GO2", "GO3","GO4","GO5","GO6","GO7","GO8","GO9"], ],\ ["GO9","GO11","GO12"]], index = ['id','super_graph','sub_graph'], columns=["GO1","GO2","GO3","GO4","GO5","GO6","GO7","GO8","GO9","]).T

1条回答

网友

1楼 · 发布于 2024-04-30 11:17:49

您可以跳过掩蔽步骤，直接转到映射。你知道吗

实际上，通过介绍下面这句话，我觉得你制造了你自己的问题。你知道吗

initial_frame_mask =  ~initial_frame.applymap(lambda cell: isinstance(cell, list))

这引入了一个对所有列表都为False的掩码，因此对于super_graph的几乎所有元素，但是对其他元素所发生的事情并不是完全透明的。你知道吗

要实现您似乎想要的目标，只需一行代码：

initial_frame = count_frame.loc[:,['id', "super_graph", "sub_graph"]] 
initial_frame.applymap(lambda l: {*l} if isinstance(l, list) else {l})

编辑：如果您不希望“无”出现在您的数据帧中，您可以先用一个方便的值替换这些值。你知道吗

initial_frame.fillna('').applymap(lambda l: {*l} if isinstance(l, list) else {l})

EDIT2：获取具有唯一项的列表的黑客解决方案（也可以作为一行程序来完成，但我认为这已经足够复杂了）：

initial_frame['ss'] = initial_frame.fillna('').applymap(lambda l: [*l] if isinstance(l, list) else []).values.sum(axis=1)
initial_frame['ss'].apply(lambda x: list(filter(None,{*x})))

相关问题更多 >

编程相关推荐

热门问题

热门文章