使用相同的列和相同的索引连接许多panda数据帧

1条回答

网友

1楼 · 发布于 2024-09-28 01:32:51

您可以读取第一个文件。重命名列以包含_pex

df = pd.read_csv('/kaggle/input/Data/ETFs/pex.us.txt')
renamed = ['Date']
renamed += [str(col) + '_pex' for col in df.columns[1:]]
df.columns = renamed

然后，您可以循环浏览这些文件，每次都给出后缀，即您从文件名获得的股票名称。然后将其与原始数据帧合并，如下所示：

counter = 0
for filename in os.listdir('/kaggle/input/Data/ETFs/'):
    if filename == 'pex.us.txt':
        continue
    name = (filename.split('.')[0])
    data = pd.read_csv('/kaggle/input/Data/ETFs/'+filename)
    renamed = ['Date']
    renamed += [str(col) + '_' + name for col in data.columns[1:]]
    data.columns = renamed
    df = pd.merge(df, data, on='Date', how='outer')
    counter +=1
    if counter == 5:
        break

请注意，我放置了一个计数器，这样您可以停止并查看结果，进行更改，然后重试。我在kaggle的在线笔记本上的时间用完了，然后当我说“重新连接”时，我得到了一个不同的目录，我不确定这是怎么回事，但希望你能明白。在执行how='outer'联接时，在合并的df中获得的日期行应该是合并的两个数据帧中的日期的并集，这样就可以解决每个文件中并非所有日期都相同的问题

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用相同的列和相同的索引连接许多panda数据帧

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >