在导入时指定dtype选项或设置low_memory=Fals

2024-05-06 17:34:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用以下代码:

df = pd.read_csv('/Python Test/AcquirerRussell3000.csv')

我有以下类型的数据:

^{pr2}$

我得到以下错误:

Pythone Test/untitled0.py:1: DtypeWarning: Columns (long list of numbers) have mixed types. 
Specify dtype option on import or set low_memory=False.

所以每三列都是日期,其余的都是数字。我想没有单一的数据类型,因为日期是字符串,其余的是浮点或整数?我有大约5000列或更多列和大约400行。在

我见过类似的问题,但不太知道如何将其应用于我的数据。此外,我想在之后运行以下代码来堆栈数据帧。在

a = np.arange(len(df.columns))
df.columns = [a % 3, a // 3]
df = df.stack().reset_index(drop=True)

df.to_csv('AcquirerRussell3000stacked.csv', sep=',')

我应该使用什么数据类型?或者我应该把低内存设置为false?在


Tags: columnscsv数据代码test类型dfread
1条回答
网友
1楼 · 发布于 2024-05-06 17:34:26

这从here解决了我的问题

dashboard_df = pd.read_csv(p_file, sep=',', error_bad_lines=False, index_col=False, dtype='unicode')

有人能给我解释一下这个答案吗?在

相关问题 更多 >