我正在使用pandas操作我的文件(其中每一行都有一个名称,因为行名称不是单独的列,列也有名称)并执行下游分析。在此过程中,我必须使用numpy
将值转换为日志值,然后再次将numpy
数组转换为dataframe
。但在这个过程中,我将同时失去列名和行名。
以下是我所做的:
df = pd.read_table(infile, index_col=0)
df2 = np.log2(np.array(df))
df3 = pd.DataFrame(df2)
要将列名添加到pandasdataframe
,我使用了以下代码:
colname = list(df.columns)
df3.columns = colname
但是我没有将行名称添加到新的dataframe
。你知道怎么做吗
以下是输入数据(df):
ABC20190124 ABC20190156
CCNO 61.300048 1.865438
MYC 7949.585246 2229.654372
CD79A 0.954767 1223.411451
以下是我得到的输出(df3):
0 1
0 5.9378 0.8995
1 12.9566 11.1226
2 -0.0667 10.2566
以下是预期输出:
ABC20190124 ABC20190156
CCNO5.9378 0.8995
MYC 12.9566 11.1226
CD79A -0.0667 10.2566
我认为这里不需要转换为numpy数组,只需使用
df
:应使用
DataFrame
构造函数中的index
和columns
参数更改您的解决方案:样本:
相关问题 更多 >
编程相关推荐