python-gpu模块的进程挖掘

pm4pygpu的Python项目详细描述


#PM4PYGPU源

欢迎使用gpu进行进程挖掘!

使用nvidia rapids框架的pm4py gpu实用程序

DFG微积分性能:

在CSV日志中,有1百万个案例和5百万个事件(驱动器上有328百万个事件)。 pandas需要5,26秒加载日志并计算dfg, 急流需要0,75秒才能完成!

在CSV日志中,包含10M个案例和48M个事件(驱动器上为3.3GB)。 pandas需要53,17秒来加载日志并计算dfg, 急流需要3,46秒才能完成!

限制: -仍然不直接支持字符串。目前,Rapids可以将它们加载为Int64,但限制为两个字符。 -带有非字母数字字符的列名正在与rapids作斗争

要导入CSV并从CSV中获取DFG,请使用以下说明:

从pm4pygpu.objects.log.importer.adapters.rapids import rapids_csv_import 从pm4pygpu.algo.dfg.adapters.rapids导入df_统计信息

df=rapids_csv_import.import_rapids_dataframe(“output.csv”) dfg=df_统计。计算dfg_频率(df) 打印(DFG)

结果:

{('a','c'):14962,('b','d'):7480,('a','b'):15038,('e','f'):11217,('c','d'):7494,('b','e'):7558,('e','g'):3809,('f','g'):22421,('d','g'):3770,('c','e'):7468,('d','f'):11204}

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
接收com。太阳媒体声音Java中来自MIDI控制器的FastShortMessage,如何解码?   JAVA日志记录:当日志文件将要滚动时,应用程序将暂停   java如何使用循环来重复函数选择   java OpenJPA和存储过程,Weblogic 12c   编码风格什么是正确的方式来使用。Java中的equals方法?   通过tcpsocket将xml从java发送到C#   java对象比JTable效率更高   java在运行时删除标志\半透明\状态   java将一个数均匀随机地分成m个部分   链表的Java数组   javajaxws:在数据库中记录请求和响应   java maven,执行标记,缺少id标记   泛型类中的java泛型转换