为什么在dask中运行.compute（）会导致“致命的Python错误：GC对象已经被跟踪”

from dask import dataframe as dd columns = ["name", "amenity", "Longitude", "Latitude"] data = dd.read_csv("POIWorld.csv", usecols=columns) with_name = data[data.name.notnull()] with_amenity = data[data.amenity.notnull()] is_starbucks = with_name.name.str.contains('[Ss]tarbucks') is_dunkin = with_name.name.str.contains('[Dd]unkin') starbucks = with_name[is_starbucks] dunkin = with_name[is_dunkin] dd.compute(starbucks.name.count(), dunkin.name.count())

1条回答

网友

1楼 · 发布于 2024-09-30 18:34:05

Pandas的某些版本不能很好地处理多线程，尤其是对于pandas.read_csv。这些问题在最新版本的Pandas中得到了修复，因此这个问题可能可以通过以下方法之一解决：

conda install pandas

pip install pandas  upgrade

编程相关推荐

OData查询在Chrome中很好，400使用Java调用
java通过网络写入数据
Java递归：示例
安卓如何修复java。util。拉链ZipException:重复条目：com/google/firebase/FirebaseApiNotAvailableException。班
java Android片段getActivity（）。onCreateView中的getApplicationContext（）为空
无法解析以下工件：javax。sql:jdbcstdex:jar:2.0，javax。事务处理：jta:jar:1.0.1B:
Java字符串解析到HashMap
java从安卓中的文本字段获取时间
java为什么我不能使用for循环实例化新对象来填充数组？
java错误：模块“tensorflow”没有属性“contrib”，你知道如何在tensorflow 1中解决这个问题吗？

相关问题更多 >

编程相关推荐

热门问题

热门文章