在Python中，如何从多个不同的文件中获取数据并添加到一个数据帧中？

2024-09-29 23:29:45 发布

您现在位置：Python中文网/ 问答频道 /正文

7676

网友

男 | 程序猿一只，喜欢编程写python代码。

我要问一些对于我的python级别来说非常复杂的问题，希望你们能理解我

这是我的数据框

# sample of my real data
data = {'RequestCode':[1111, 2222, 8888, 1212, 2222,1010, 1111],
        'Code':['J1', 'J2', 'J8', 'J12', 'J2', 'J10', 'J1'],
        'OrderDate':[20210218, 20210303, 20210303, 20210515, 20210515, 20210218, 20210515]}
  
# Create DataFrame
df = pd.DataFrame(data)

df
    RequestCode Code    OrderDate
0   1111      J1    20210218
1   2222      J2    20210303
2   8888      J8    20210303
3   1212      J12   20210515
4   2222      J2    20210515
5   1010      J10   20210218
6   1111      J1    20210515

我还有一个包含数十个csv文件的文件夹，但是所有文件都具有相同的结构。它们都命名为文件{date}.csv 每个由四个Coulmn组成[日期、代码、成本、编号]

例如，“file20210303.csv”如下所示

Date        Code    Cost    Number
20200512    8888    500     32581
20200803    2222    1500    21669
20210501    1313    2000    5679

“file20210218.csv”是这样的

Date        Code    Cost    Number
20210512    1111    1500    66581
18200803    3333    1500    21669
20210501    1010    2000    5679

现在我想获取每个.csv文件的编号（第四列），其中文件名中的{date}与数据帧“OrderDate”相同，“RequestCode”与csv中的“Code”相同

因此，基本上是将一个新列作为编号添加到我的数据帧中

df
    RequestCode Code    OrderDate   Number
0   1111      J1    20210218       66581
1   2222      J2    20210303       21669
2   8888      J8    20210303       32581
3   1212      J12   20210515
4   2222      J2    20210515   
5   1010      J10   20210218       5679
6   1111      J1    20210515

我该怎么做？如有任何意见，将不胜感激

Tags：文件 csv 数据 number df data code 编号

1条回答

网友

1楼 · 发布于 2024-09-29 23:29:45

使用pd.merge

df1 = pd.read_csv('file20210303.csv')
df = pd.merge(df, df1, how = 'left', left_on =['RequestCode', 'OrderDate'], right_on =['Code','Date'])
df = df.drop(['Cost'], axis=1)

在Python中，如何从多个不同的文件中获取数据并添加到一个数据帧中？

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Python中，如何从多个不同的文件中获取数据并添加到一个数据帧中？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >