python数据帧填充,例如bfill、ffill

2024-09-28 03:11:47 发布

您现在位置:Python中文网/ 问答频道 /正文

填写一个非常大的数据帧有两个问题。这幅画有一部分。我想把E和F的1000降到26,再也不要了。以同样的方式,我希望2000年被拉到-1和下一个26。我原以为我可以用bfill和ffill做到这一点,但不幸的是,我不知道如何……(图1) enter image description here

另一个问题是,在-1到26之间的值不包含E和F中的任何值的列中出现。我如何删除它们或用0填充它们,以便没有bfill或ffill在其中生成错误的条目? (图2) enter image description here

import pandas as pd
import numpy as np

data = '/Users/Hanna/Desktop/Coding/Code.csv'


df_1 = pd.read_csv(data,usecols=["A",
                           "B",
                           "C",
                           "D",
                           "E",
                           "F",
                           ],nrows=75)


base_list =[-1,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26]
df_c = pd.MultiIndex.from_product([
[4000074],
["SP000796746","SP001811642"],
[201824, 201828, 201832, 201835, 201837, 201839, 201845, 201850, 201910, 201918, 201922, 201926, 201909, 201916, 201918, 201920],
base_list],

names=["A", "B", "C", "D"]).to_frame(index=False)
df_3 = pd.merge(df_c, df_1, how='outer')

为了更好地理解它,我将示例缩短了一点。图3显示填充时的外观,图4显示填充正确 enter image description here

enter image description here


Tags: csv数据importpandasdfdatabaseas
2条回答

假设您必须查找并填充特定线段的值

data = pd.read_csv('/Users/Hanna/Desktop/Coding/Code.csv')    
for i in range(0,data.shape[0],27):
        if i+27 < data.shape[0]:
            data.loc[i:i+27,'E'] = max(data['E'].iloc[i:i+27])
        else:
            data.loc[i:data.shape[0],'E'] = max(data['E'].iloc[i:data.shape[0]])

您可以将max替换为您想要的任何内容

可以找到具有-1的索引,然后对要填充的列进行切片/循环

仅创建示例数据:

import pandas as pd
df = pd.DataFrame(columns=list('ABE'))
df['A']=list(range(-1, 26)) * 10

在每个部分添加随机值

import random 

for i in df.index:
    if i%27 == 0:
        df.loc[i,'B'] = random.random()
    else:
        df.loc[i, 'B'] = 0

找到要切片的索引

indx = df[df['A'] == -1].index.values

填写“E”列中的数据

for i, j in zip(indx[:-1], indx[1:]):
    df.loc[i:j-1, 'E'] = df.loc[i:j-1, 'B'].max()

    if j == indx[-1]:
        df.loc[j:, 'E'] = df.loc[j:, 'B'].max()

相关问题 更多 >

    热门问题