python-dask模块的进程挖掘
pm4pydask的Python项目详细描述
#PM4密码任务
高效的数据帧处理,对于不能直接存储在内存中的大文件!
要加载DASK数据帧,可以使用以下说明:
将dask.dataframe导入为dd df=dd.read_csv(“c:\ roadtraffic.csv”)
然后,可以使用以下指令获得直接跟随图(尽管速度比pm4py例程提供的慢得多):
dfg=计算频率(df)
可以通过
从pm4pydak.conversion.to_parquet import read_csv_path_to_parquet_目录
读取“CSV路径”到“拼花地板”目录(“<;<;路径到CSV>;”,“<;<;路径到将包含拼花地板文件的文件夹”>;)