大Pandas与大型hmda d一起工作

2024-10-06 12:40:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用following data,但仍然有内存错误。你知道吗

如果我能够读入整个csv,我将能够通过如下操作回答诸如每个action_taken_name的项目总数之类的问题:

df = pd.pread_csv('path/to/my_file.csv')
df.groupby('action_taken_name').agg({'action_taken_name':'count'})

考虑到内存限制,最聪明的方法是什么?你知道吗

我不断遇到各种各样的问题,觉得一定有更好的办法。你知道吗

谢谢!你知道吗


Tags: csvtopath项目内存namedfdata