用唯一值转换dataframe中的一列pandas

datas = [['RAC1','CD0287',1.52,1.40,1.45,1.51], ['RAC1','CD0695',2.08,1.40,1.45,1.51], ['RAC1','ADN103-1',2.01,1.40,1.45,1.51], ['RAC3','CD0258',1.91,1.38,1.43,1.45], ['RAC3','ADN103-3',1.66,1.38,1.43,1.45], ['RAC8','CD0558',1.32,1.42,1.48,1.53], ['RAC8','ADN103-8',2.89,1.42,1.48,1.53]] labels = ['Plate', 'Sample', 'LogRatio', 'm1', 'm2', 'm3'] df = pd.DataFrame(data = datas, columns=labels) Plate Sample LogRatio m1 m2 m3 RAC1 CD0287 1.52 1.40 1.45 1.51 RAC1 CD0695 2.08 1.40 1.45 1.51 RAC1 ADN103-1 2.01 1.40 1.45 1.51 RAC3 CD0258 1.91 1.38 1.43 1.45 RAC3 ADN103-3 1.66 1.38 1.43 1.45 RAC8 CD0558 1.32 1.42 1.48 1.53 RAC8 ADN103-8 2.89 1.42 1.48 1.53

df['M'] = (1.40 + 1.45 + 1.51 + 2.01) / 4 Plate Sample LogRatio m1 m2 m3 M RAC1 CD0287 1.52 1.40 1.45 1.51 1,5925 RAC1 CD0695 2.08 1.40 1.45 1.51 RAC1 ADN103-1 2.01 1.40 1.45 1.51 RAC3 CD0258 1.91 1.38 1.43 1.45 RAC3 ADN103-3 1.66 1.38 1.43 1.45 RAC8 CD0558 1.32 1.42 1.48 1.53 RAC8 ADN103-8 2.89 1.42 1.48 1.53

1条回答

网友

1楼 · 发布于 2024-10-05 10:15:43

思考一下不同专栏的性质是有帮助的。在本例中，“Plate”和“Sample”列看起来更像是索引信息。因此，首先我将“Plate”列转换为索引，以便更容易地分割数据帧：

import pandas as pd
import numpy as np

datas = [['RAC1','CD0287',1.52,1.40,1.45,1.51], ['RAC1','CD0695',2.08,1.40,1.45,1.51], ['RAC1','ADN103-1',2.01,1.40,1.45,1.51], ['RAC3','CD0258',1.91,1.38,1.43,1.45], ['RAC3','ADN103-3',1.66,1.38,1.43,1.45], ['RAC8','CD0558',1.32,1.42,1.48,1.53], ['RAC8','ADN103-8',2.89,1.42,1.48,1.53]]
labels = ['Plate', 'Sample', 'LogRatio', 'm1', 'm2', 'm3']
df = pd.DataFrame(data = datas, columns=labels)

df.set_index('Plate', inplace=True)

然后，您可以循环“Plate”索引中的唯一值，并将适当的Log_值分配给该数据帧的新列。在

^{pr2}$

然后把最后四列加起来除以四。在

df['M'] = df.loc[:, 'm1':'ADN_LogValues'].sum(axis=1)/4.0

这会产生：

         Sample  LogRatio    m1    m2    m3  ADN_LogValues       M
Plate
RAC1     CD0287      1.52  1.40  1.45  1.51           2.01  1.5925
RAC1     CD0695      2.08  1.40  1.45  1.51           2.01  1.5925
RAC1   ADN103-1      2.01  1.40  1.45  1.51           2.01  1.5925
RAC3     CD0258      1.91  1.38  1.43  1.45           1.66  1.4800
RAC3   ADN103-3      1.66  1.38  1.43  1.45           1.66  1.4800
RAC8     CD0558      1.32  1.42  1.48  1.53           2.89  1.8300
RAC8   ADN103-8      2.89  1.42  1.48  1.53           2.89  1.8300

相关问题更多 >

编程相关推荐

热门问题

热门文章