我要问一些对于我的python级别来说非常复杂的问题,希望你们能理解我
这是我的数据框
# sample of my real data
data = {'RequestCode':[1111, 2222, 8888, 1212, 2222,1010, 1111],
'Code':['J1', 'J2', 'J8', 'J12', 'J2', 'J10', 'J1'],
'OrderDate':[20210218, 20210303, 20210303, 20210515, 20210515, 20210218, 20210515]}
# Create DataFrame
df = pd.DataFrame(data)
df
RequestCode Code OrderDate
0 1111 J1 20210218
1 2222 J2 20210303
2 8888 J8 20210303
3 1212 J12 20210515
4 2222 J2 20210515
5 1010 J10 20210218
6 1111 J1 20210515
我还有一个包含数十个csv文件的文件夹,但是所有文件都具有相同的结构。 它们都命名为文件{date}.csv 每个由四个Coulmn组成[日期、代码、成本、编号]
例如,“file20210303.csv”如下所示
Date Code Cost Number
20200512 8888 500 32581
20200803 2222 1500 21669
20210501 1313 2000 5679
“file20210218.csv”是这样的
Date Code Cost Number
20210512 1111 1500 66581
18200803 3333 1500 21669
20210501 1010 2000 5679
现在我想获取每个.csv文件的编号(第四列),其中文件名中的{date}与数据帧“OrderDate”相同,“RequestCode”与csv中的“Code”相同
因此,基本上是将一个新列作为编号添加到我的数据帧中
df
RequestCode Code OrderDate Number
0 1111 J1 20210218 66581
1 2222 J2 20210303 21669
2 8888 J8 20210303 32581
3 1212 J12 20210515
4 2222 J2 20210515
5 1010 J10 20210218 5679
6 1111 J1 20210515
我该怎么做?如有任何意见,将不胜感激
使用pd.merge
相关问题 更多 >
编程相关推荐