我需要创建一个.csv文件并将多个数据帧的子集附加到其中。在
所有数据帧的结构都是相同的,但是我需要创建带头的输出数据集,然后附加所有没有头的后续数据帧。在
我知道我可以使用第一个数据帧中的头来创建输出文件,然后在那里执行一个没有头的append循环,但是我真的很想学习如何以更有效的方式完成这项工作。在
path ='/Desktop/NYC TAXI/Green/*.csv'
allFiles = glob.glob(path)
for file in allFiles:
df = pd.read_csv(file, skiprows=[1,2], usecols=np.arange(20))
metsdf = df.loc[df['Stadium_Code'] == 2]
yankdf = df.loc[df['Stadium_Code'] == 1]
with open('greenyankeetaxi.csv','a') as yankeetaxi:
yankdf.to_csv(yankeetaxi,header=false)
with open('greenmetstaxi.csv','a') as metstaxi:
metsdf.to_csv(metstaxi,header=false)
print(file + " done")
为了有效地实现这一点,您可以使用Merge, join, and concatenate中的一个,这样您就有了两个完整的数据帧(}),然后像以前一样使用
yankdf
和{to_csv
写入csv。在当前数据
这里有两个数据帧,每个文件一个:
第一个数据帧
df
第二个数据帧
^{pr2}$df2
使用append
上面的行将生成一个可以写入文件的df
简而言之:
相关问题 更多 >
编程相关推荐