在Pandas DataFrame多行头中标记空值

网友

1楼 · 编辑于 2024-09-30 18:29:26

我认为不可能使用read_csv，您可以在加载后修改索引，即：

from io import StringIO

txt = '''Name,Height,Age
"",Metres,""
A,-1,25
B,95,-1'''

df = pd.read_csv(StringIO(txt),header=[0,1],na_values=['-1',''])

df.columns = df.columns.set_levels(df.columns.get_level_values(level=1).str.replace('Un.*',''),level=1)
df.columns = df.columns.set_levels(df.columns.get_level_values(level=1).str.replace('Un.*',''),level=1)

输出：

^{pr2}$

懂得分配数据框列您可以检查两次here。它仍然很神秘

编辑，set_levels仍然有缺陷，您可以使用：

df.columns = df.columns.set_levels(df.columns.levels[1].str.replace('Un.*', ''), level=1)

网友

2楼 · 编辑于 2024-09-30 18:29:26

import pandas as pd
pd.read_csv("mrh.csv").fillna("-").to_csv("mrh.csv",index=None)
df1 = pd.read_csv("mrh.csv",header=[0,1],na_values=[-1,''])
df1

输出：

^{pr2}$

网友

3楼 · 编辑于 2024-09-30 18:29:26

您可以创建新的多重索引并分配给columns：

df = pd.read_csv('mrh.csv', header=[0,1], na_values=[-1,''])

a = df.columns.get_level_values(level=0)
b = df.columns.get_level_values(level=1).str.replace('Un.*','')
df.columns = [a, b]
print (df)
  Name Height   Age
       Metres      
0    A    NaN  25.0
1    B   95.0   NaN

或者：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Pandas DataFrame多行头中标记空值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >