Python ruleset包_程序模块 - PyPI

贝叶斯规则集挖掘

ruleset的Python项目详细描述

贝叶斯规则集挖掘

从数据中查找规则集
输入数据应遵循以下格式：
x必须是pandas数据帧
所有列名不能包含“u”或“<；”
，列名不能是纯数字
分类数据应以字符串
（例如，gender必须是'male'/'female'，
或'0'/'1'才能分别表示male和female。）
解析器将只识别这种格式的数据。
因此在使用
函数之前，请先转换数据集。
y hass to be a numpy.ndarray

引用：
wang，tong，et al.可解释分类的贝叶斯规则集，“
数据挖掘（icdm），2016年ieee第16届国际会议。IEEE，2016。
BR/>输入数据格式非常挑剔。BR/> X需要是一个熊猫数据文件，
Y需要一个ND.BR/> BR/>参数
-
Max规则：INT，缺省5000 BR/>规则生成时的最大规则数
BR/> Max ITER：INT，默认值200 BR/>最大数迭代以查找规则集

并行运行的链数

support:int，默认值5
support是要选择的项集
的百分位阈值。

规则中的最大项目数需要将所有阿尔法1替换为AlpHAY+BR/>阿尔法1：浮标，默认值100＜Br/> AlpHAY+BR/> BR/> BETAY1：浮点，默认值1 BR/> BETAA++BR/>< BR/>阿尔法2：浮标，默认值100 BR/> alpHAY-
< BR/> BETAY2：浮标，默认值1＜BR/>beta_-

alpha_l：浮点数组，shape（maxlen+1，）
默认所有元素为1

beta_l：浮点数组，shape（maxlen+1，）
默认对应的模式空间

级别：int，默认4
处理数字连续特征的间隔数

neg：布尔值，默认值true
否定功能

add_rules:list，default empty
要添加的用户定义规则
它需要用户添加规则的数字版本

条件：str，当规则多于max_规则时，默认“精度”
，
用于筛选规则的条件

贪婪初始化：布尔值，默认值为false
是否使用贪婪初始化（根据精度）启动规则集

贪婪阈值：浮点值，默认值0.05
贪婪算法的阈值
查找起始规则集

建议阈值：浮点，默认值0.1
接受建议的阈值

方法：str，默认值“fpgrowth”
用于生成规则的方法。
可以是“fpgrowth”或“forest”
请注意，如果可能有许多规则
，那么fpgrowth不是一个好方法，因为它会
出现内存问题（因为规则生成后的规则筛选是

ruleset import中的示例用法

y=（DF[收入]＝`& gt；50k）. asbR/> df.DROP（‘收入’，轴＝1，InPosie= TRUE）< BR/>模型= BayeSeiangRuleSET（方法＝‘森林’）
模型。“工人阶级”，“FNLWGT”，“教育”y）

欢迎加入QQ群-->： 979659372

ruleset 1.0.1

ruleset的Python项目详细描述

推荐PyPI第三方库

pybarycuda

streamkit

shaclgen

hydra-api

upymenu

coniql

adaptive-learning

django-valerie

pytwoway-pkg

slims-lisp

datasette-insert-unsafe

topsis-101703161-A-deven

jsa-auth-middleware

renault-api

verse16

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

ruleset 1.0.1

ruleset的Python项目详细描述

推荐PyPI第三方库

pybarycuda

streamkit

shaclgen

hydra-api

upymenu

coniql

adaptive-learning

django-valerie

pytwoway-pkg

slims-lisp

datasette-insert-unsafe

topsis-101703161-A-deven

jsa-auth-middleware

renault-api

verse16

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签