如何使用python生成表示简单查找表逻辑的PMML

2024-06-01 22:15:18 发布

您现在位置:Python中文网/ 问答频道 /正文

以决策表(或查找表)的形式定义逻辑,例如

df = pd.DataFrame(    np.random.choice([0, 1]
                    , size=(4,2))
                    , columns=list('AB')
                    , index=list('CDEF')
                 )

这样就有2个输入,一个可以是“A”或“B”,另一个可以是“C”、“D”、“E”或“F”,并且对于每个输入组合,逻辑返回“1”或“0”。在

问题是以编程方式生成表示此逻辑的PMML文档。在

溶液的理想性质为:

  • 高效的运行时性能,可根据决策矩阵的维数进行调整-fast
  • 紧凑的PMML文档-小的
  • 最小的“定制”编码(使用现有的开源)——简单/(可移植
  • 简单

注意事项:

上面的“运行时性能”指的是执行时PMML表示的模型的复杂性。它不涉及构建PMML文档所花费的时间。在

“矩阵维数”指的是矩阵的一个或多个维度变大,例如,第二个输入可以采用100万个状态中的任何一个。在

尽管出于演示的目的,pandas数据框架用于定义逻辑,但这不需要约束解决方案。它只是一个由1和0组成的n乘m矩阵,定义了2个输入的每个可能组合的“输出”,其中第一个输入可以有n个可能的状态,第二个输入可以有m个可能的状态。在

可能的资源/提示:sklearnsklearn2pmmlsklearn-pandas。在


Tags: 文档pandasdf定义状态矩阵逻辑sklearn