它用于快速构建记分卡项目和二分法模型包。

mksc的Python项目详细描述


Make Scorecard(mksc)

快速构建二分类模型,标准化特征工程以及拓展制作评分卡,文件说明见docs\instruction.md

1. 安装工具包

pip install mksc

2. 创建项目

命令行工具创建项目

mksc project_name

3. 修改项目配置

修改project_name\config\configuration.ini文件,进行项目配置

4. 探索性数据分析

进行探索性数据分析python project_name\eda.py
生成:

  • 数据报告: project_name\result\report.html
  • 抽样数据: project_name\result\sample.xlsx
  • 特征配置: project_name\config\variable_type.csv

5. 修改特征配置

修改project_name\config\variable_type.csv文件,进行特征配置,配置列说明如下:

  • isSave:变量是否保留进行特征工程
    • 取值:0-不保留;1-保留
  • Type: 变量类型
    • 取值: numeric-数值类型;category-类别类型;datetime-日期类型;label-标签列

5. 自定义数据清洗

编写自定义数据清洗与特征组合过程函数project_name\custom.py
自定义过程封装在Custom类中,定义了2个静态方法,clean_data用于处理行方向的数据与值修改, feature_combination用于扩展列。CustomModel类用于替换训练模型,CustomApply类用于替换应用过程。

6. 训练模块

完成以上配置后,执行特征工程python project_name\feature.py
完成特征工程,执行训练python project_name\train.py
模型结果、特征工程结果均置于project_name\result下.
至此完成二分类项目构建

7. 评分卡与模型调整

如果训练逻辑回归模型可选制作评分卡 python project_name\score.py
TODO python project_name\adjust.py

8. 模型应用与预测

python project_name\apply.py
python project_name\run.py

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
来自偏移量的java JavaPairInputStream流   gzip Java TarInputStream读取tar的文件名。包含另一个tar的gz文件。gz文件   如何在Linux shell脚本中确定和使用实际的java路径   java请求太多FirebaseError   java错误json解析   java在localserver上发送安卓应用程序的输出   JavaSpring:启动和停止webapplication时更新DBtable条目   java如何使用JavaFX在矩形处设置文本?   java SQL查询在Hibernate中出现异常   java我无法使用javamail代码通过outlook(hotmail帐户)配置发送邮件,但在gmail中工作正常   java是不同的持久性。测试运行/JPA装置的xml属性   无头Eclipse的java导出战   使用ContentVersionStrategy的java Spring引导缓存禁止使用gzip进行资源压缩   java如何获取计算机的设备令牌?   图像文件的java ImageInfo不包含有效值   继承强制在Java中使用基类方法