根据pandas中的另一个dafaframe添加两个新列

Name start1 end1 strand length OK0100087.1 187 250 + 63 OK0100087.1 830 750 - 80 OK0100087.1 500 625 + 125 OK0100087.1 375 275 - 100 OK0100087.1 150 20 - 120 OK0100088.1 600 1000 + 400

Name start1 end1 strand length Newstart Newend OK0100087.1 187 250 + 63 OK0100087.1 830 750 - 80 OK0100087.1 500 625 + 125 OK0100087.1 375 275 - 100 OK0100087.1 150 20 - 120 OK0100088.1 600 1000 + 400

Name start_plus end_plus start_minus end_minus OK0100087.1_0 0 375 1000 625 OK0100087.1_1 376 750 624 250 OK0100087.1_3 751 1000 249 0 OK0100088.1 0 12000 0 12000 OK0100089.1_0 0 566 3000 2433 OK0100089.1_1 567 3000 2432 0

if df1.strand.eq("-"): df1.Newstart = df1.start1 - df2.end_minus df1.Newend = df1.Newstart - df1.length if df1.strand.eq("+"): df1.Newstart = df1.start1 - df2.start_plus df1.Newend = df1.Newstart + df1.length

Name start1 end1 strand length Newstart Newend OK0100087.1 187 250 + 63 OK0100087.1 830 750 - 80 OK0100087.1 500 625 + 125 OK0100087.1 375 275 - 100 OK0100087.1 150 20 - 120

Name start1 end1 strand length Newstart Newend OK0100087.1 187 250 + 63 187 250 OK0100087.1 830 750 - 80 OK0100087.1 500 625 + 125 OK0100087.1 375 275 - 100 OK0100087.1 150 20 - 120 OK0100088.1 500 700 + 200

Name start1 end1 strand length Newstart Newend OK0100087.1 187 250 + 63 187 250 OK0100087.1 830 750 - 80 205 125 OK0100087.1 500 625 + 125 OK0100087.1 375 275 - 100 OK0100087.1 150 20 - 120 OK0100088.1 500 700 + 200

Name start1 end1 strand length Newstart Newend OK0100087.1 187 250 + 63 187 250 OK0100087.1 830 750 - 80 205 125 OK0100087.1 500 625 + 125 125 250 OK0100087.1 375 275 - 100 125 25 OK0100087.1 150 20 - 120 150 20 OK0100088.1 600 1000 + 200 33 433

1条回答

网友
1楼 · 发布于 2024-04-28 07:41:41

从您的示例中不清楚名称是否唯一，以及如果来自df1的某些名称与来自df2的多个名称匹配，该怎么办
无论如何，我建议使用DataFrame.apply方法。该方法在向每一行（Newstart和Newend属性）添加新列时接收一个它将应用于每一行的函数（在args中指定axis=1，否则默认为0）
例如：
def func(row-from-df): df2Portion = d2[d2[Name].str.contains(row-from-df[Name], na=False)] # using vectorize string if row-from-df.strand.eq('+'): # your logic here, you can add rows etc.. else: # your logic here return row-from-df df1.apply(func, axis=1)
请注意，必须返回已更改的行
还请注意，返回值是一个新的数据帧，而不是更改原始df1
你可以阅读更多here

相关问题更多 >

编程相关推荐

热门问题

热门文章