用Datafram的第一个非零值替换fillna值

,VM,Storage Capacity MB,Memory Capacity MB,Powerstate,CPUs 0,abc1234,102400.0,4096,poweredOn,1 1,xyz1234,81920.0,4096,poweredOn,1 2,abc1234,102400.0,4096,poweredOff,1 3,xyz1234,81920.0,4096,poweredOff,1

import pandas file2 = pd.read_csv(r'c:\temp\pd_powerstate_new_south.csv') file2 = pd.read_csv(r'c:\temp\pd_powerstate_new_south.csv') file1.set_index('VM') file2.set_index('VM') merged_data = pd.merge(left = file1, right = file2, how = 'outer') merged_data.fillna("some custom method").to_csv(r'c:\temp\mergeddata.csv')

2条回答

网友

1楼 · 编辑于 2024-09-25 02:38:36

很明显，你想通过虚拟机来实现，所以你错过了一个groupby。它也是一种正向填充（ffill）（类似于在Excel中向下拖动公式的方式）

df.groupby('VM').apply(lambda x: x.fillna(method='ffill'))

结果：

        VM  Storage Capacity MB  Memory Capacity MB  Powerstate  CPUs
0  abc1234             102400.0                4096   poweredOn     1
1  xyz1234              81920.0                4096   poweredOn     1
2  abc1234             102400.0                4096  poweredOff     1
3  xyz1234              81920.0                4096  poweredOff     1

网友

2楼 · 编辑于 2024-09-25 02:38:36

不确定您的数据帧有多少个非NA值。如果只有几个，可以尝试df.ffill（）.bfill（）或df.bfill（）.ffill（）的组合，只取找到的非na值并向前/向后扩展

如果有许多非na值，我建议通过在列中循环来解决：

for col in merged_data.columns:
    first_non_na_value = merged_data[col].dropna().iloc[0]
    merged_data[col] = merged_data[col].fillna(first_non_na_value)

相关问题更多 >

编程相关推荐

热门问题

热门文章