如何在不覆盖列值的情况下连接数据帧

import pandas as pd sample = [] area = pd.Series({'California':423967, 'Texas':695662}) pop = pd.Series({'California':38332521, 'Texas':26448193}) data = pd.DataFrame({'area':area, 'pop':pop}) print(data) for i in range(10): data['wk'] = i sample.append(data) print(data) res = pd.concat(sample) res.to_excel("Concatenating DataFrames.xlsx", index=False)

2条回答

网友

1楼 · 编辑于 2024-09-26 22:10:44

在一个循环中生成多个数据帧并将它们连接起来是非常低效的。最好在列表或字典上进行迭代，然后在循环后创建一个数据帧。下面，我已将您的系列文章转换回字典。请注意，在循环的每次迭代中都必须复制字典，以便循环不会不断改变原始字典

import pandas as pd
import openpyxl
from copy import deepcopy

area = pd.Series({'California':423967, 'Texas':695662})
pop = pd.Series({'California':38332521, 'Texas':26448193})
area_d = area.to_dict()
pop_d = pop.to_dict()

sample = []
for i in range(10):
    area_copy = deepcopy(area_d)
    pop_copy = deepcopy(pop_d)
    area_copy['wk'] = i
    pop_copy['wk'] = i
    sample += [area_copy, pop_copy]
df = pd.DataFrame(sample)
df.to_excel("result.xlsx", index = False)

网友

2楼 · 编辑于 2024-09-26 22:10:44

这里的问题在于，当您将数据附加到列表中时，它不会为它创建单独的内存，而是它们都引用相同的内存，这就是为什么在循环中最后一次更新后，它会变成9或最终值

替换

sample.append(data)

与

sample.append(data.copy())

.copy（）将为循环中的每个df创建新内存

相关问题更多 >

编程相关推荐

热门问题

热门文章