我有包含多个工作表的Excel文件,每个工作表看起来有点像这样(但要长得多):
Sample CD4 CD8
Day 1 8311 17.3 6.44
8312 13.6 3.50
8321 19.8 5.88
8322 13.5 4.09
Day 2 8311 16.0 4.92
8312 5.67 2.28
8321 13.0 4.34
8322 10.6 1.95
第一列实际上是四个垂直合并的单元格。
当我使用pandas.read_excel阅读本文时,会得到一个如下所示的数据框:
Sample CD4 CD8
Day 1 8311 17.30 6.44
NaN 8312 13.60 3.50
NaN 8321 19.80 5.88
NaN 8322 13.50 4.09
Day 2 8311 16.00 4.92
NaN 8312 5.67 2.28
NaN 8321 13.00 4.34
NaN 8322 10.60 1.95
我怎样才能让熊猫理解合并的细胞,或者快速方便地根据适当的值移除NaN和group?(一种方法是重置索引,逐步查找值并用值替换nan,传入日期列表,然后将索引设置为列。但似乎应该有一种更简单的方法。)
您可以使用Series.fillna方法来forword填充NaN值:
例如
相关问题 更多 >
编程相关推荐