python按列中的值重复csv/DataFrame中的行

2024-06-28 20:58:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我想在csv/DataFrame中按标题为“Mstg”的列中的数字重复行。输出应该是一个csv文件,大约有0.5M行(太大了!)。 csv文件有以下列:“年”、“月”、“小时”、“价格1”、“价格2”…“Mstg”、“GW”。列中的所有字段都标识为数字(浮点数或整数)。你知道吗

我试过以下方法,但不起作用。是不是我想让行重复的列或列中的数字无法识别?你知道吗

import pandas as pd
import numpy as np 
project = pd.DataFrame.from_csv("path",header=0, sep=',')

#change columns names "Mstg" and "GW" to integers 
cols1 = ['Mstg']
cols2 = ['GW']
project[cols1] = project[cols1].applymap(np.int64)
project[cols2] = project[cols2].applymap(np.int64)


#repeat rows by number in Mstg column
 project_expanded =project.loc[np.repeat(project.index.values,project.Mstg)]

当我跑的时候pd.DataFrame.describe描述(project_expanded),控制台不显示任何内容。你知道吗


Tags: 文件csvimportprojectdataframeasnp价格