2024-10-04 03:19:38 发布
网友
我正在尝试使用python阅读器导入分块数据,以克服内存错误,并使用DicVectorizer将字符串转换为浮动数据类型。但我可以看到两个不同的字符串在转换后有相同的代码。我们是否有其他方法/选项对分块数据进行数据类型转换
在0.19中,可以在read\u csv中将列声明为Categorial。见documentaion
因此,作为doc的一个示例,您可以像这样在csv中键入一个名为col1的列,以减少内存占用:
col1
pd.read_csv(StringIO(data), dtype={'col1': 'category'})
在0.19中,可以在read\u csv中将列声明为Categorial。见documentaion
因此,作为doc的一个示例,您可以像这样在csv中键入一个名为
col1
的列,以减少内存占用:相关问题 更多 >
编程相关推荐