这个包为机器学习任务提供帮助工具。一个主要的用途是计算证据的重量

mlh的Python项目详细描述


机器学习助手

这个包使用多个算法和参数来适应不同的用例集,以帮助创建多个机器学习算法。

1.0悲哀(证据的重要性):

该功能有助于计算证据权重和信息值,显示图表并进行粗分类。

1.1参数:


  • max_bin:整数 数值变量的最大容器数。默认值为10
  • iv_阈值:浮点 信息值的阈值。转换将考虑高于阈值的变量
  • 忽略阈值:布尔值 此参数控制是否应考虑或忽略定义的阈值。默认值为“true”

1.2返回:

数据帧,具有每个列的证据权重以及目标变量


1.3方法:

  1. 制造不幸的实例 我的悲哀=悲哀()

  2. 通过传递dataframe和目标变量名对定义的对象调用fit方法 我的不幸适合(df,target)

  3. 调用转换方法 transformed_df=my_woe.transform()


示例

创建示例数据帧

frommlhimportwoeimportpandasaspdimportnumpyasnpimportrandomseed=1456np.random.seed(seed)random.seed(seed)
rows=1000
y=random.choices([0,1],k=rows,weights=[.7,.3])
x1=random.choices(np.arange(20,40),k=rows)x2=np.random.randint(1000,2000,size=rows)x3=random.choices(np.arange(1,100),k=rows)x4=random.choices(['m','f','u'],k=rows)x5=random.choices(['a','b','c','d','e','f','g','h'],k=rows)
df=pd.DataFrame({'y':y,'x1':x1,'x2':x2,'x3':x3,'x4':x4,'x5':x5})
df.head()

拟合与预测

创建证据包权重实例

my_woe=woe()

将数据与创建的实例匹配

my_woe.fit(df,'y')

显示相关图表

my_woe.getWoeCharts()

使用第一次迭代的证据权重图表合并x3变量在1和2个索引处的值

my_woe.reset_woe(2,(1,2),1)

获取最新迭代信息值

my_woe.get_IV()

用证据权重替换数据帧中的原始值

transformed_df=my_woe.transform()

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
接收com。太阳媒体声音Java中来自MIDI控制器的FastShortMessage,如何解码?   JAVA日志记录:当日志文件将要滚动时,应用程序将暂停   java如何使用循环来重复函数选择   java OpenJPA和存储过程,Weblogic 12c   编码风格什么是正确的方式来使用。Java中的equals方法?   通过tcpsocket将xml从java发送到C#   java对象比JTable效率更高   java在运行时删除标志\半透明\状态   java将一个数均匀随机地分成m个部分   链表的Java数组   javajaxws:在数据库中记录请求和响应   java maven,执行标记,缺少id标记   泛型类中的java泛型转换