贝叶斯规则集挖掘

ruleset的Python项目详细描述


贝叶斯规则集挖掘

从数据中查找规则集
输入数据应遵循以下格式:
x必须是pandas数据帧
所有列名不能包含“u”或“<;”
,列名不能是纯数字
分类数据应以字符串
(例如,gender必须是'male'/'female',
或'0'/'1'才能分别表示male和female。)
解析器将只识别这种格式的数据。
因此在使用
函数之前,请先转换数据集。
y hass to be a numpy.ndarray

引用:
wang,tong,et al.可解释分类的贝叶斯规则集,“
数据挖掘(icdm),2016年ieee第16届国际会议。IEEE,2016。
BR/>输入数据格式非常挑剔。BR/> X需要是一个熊猫数据文件,
Y需要一个ND.BR/> BR/>参数
-
Max规则:INT,缺省5000 BR/>规则生成时的最大规则数
BR/> Max ITER:INT,默认值200 BR/>最大数迭代以查找规则集

并行运行的链数


support:int,默认值5
support是要选择的项集
的百分位阈值。

规则中的最大项目数需要将所有阿尔法1替换为AlpHAY+BR/>阿尔法1:浮标,默认值100<Br/> AlpHAY+BR/> BR/> BETAY1:浮点,默认值1 BR/> BETAA++BR/>< BR/>阿尔法2:浮标,默认值100 BR/> alpHAY-
< BR/> BETAY2:浮标,默认值1<BR/>beta_-

alpha_l:浮点数组,shape(maxlen+1,)
默认所有元素为1

beta_l:浮点数组,shape(maxlen+1,)
默认对应的模式空间

级别:int,默认4
处理数字连续特征的间隔数

neg:布尔值,默认值true
否定功能

add_rules:list,default empty
要添加的用户定义规则
它需要用户添加规则的数字版本

条件:str,当规则多于max_规则时,默认“精度”

用于筛选规则的条件

贪婪初始化:布尔值,默认值为false
是否使用贪婪初始化(根据精度)启动规则集

贪婪阈值:浮点值,默认值0.05
贪婪算法的阈值
查找起始规则集


建议阈值:浮点,默认值0.1
接受建议的阈值

方法:str,默认值“fpgrowth”
用于生成规则的方法。
可以是“fpgrowth”或“forest”
请注意,如果可能有许多规则
,那么fpgrowth不是一个好方法,因为它会
出现内存问题(因为规则生成后的规则筛选是




ruleset import中的示例用法

y=(DF[收入]=`& gt;50k). asbR/> df.DROP(‘收入’,轴=1,InPosie= TRUE)< BR/>模型= BayeSeiangRuleSET(方法=‘森林’)
模型。“工人阶级”,“FNLWGT”,“教育”y)



欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java JavaBridge errno=10054被Remotehost关闭   javafx如何在每次调用方法中的变量时更新它?(爪哇)   java mod_群集在发现后未平衡负载   Java软件编辑器/语法高亮   java为什么不能强制转换数组的结果。asList()到ArrayList?   java HIBERNATE:无法使用HIBERNATE从MySQL中提取数据   java在Google地图片段上添加布局   java在AbstractTableModel中执行setValueAt之前,我如何做一些事情?   java在整个Tomcat运行时保存变量   java如何在Thymeleaf模板中获取环境变量的值?   java Selenium Chrome驱动程序针对属性的标签   java正则表达式捕获未知数量的重复组