我正在寻找一种在PMML模型中应用一些聚合方法的方法(没有具体的示例,只是想看看是否可行)
在PMML Transformations page的文档中有一段关于聚合的文章,定义为应用六个函数的方法:计数、求和、平均、最小、最大和多集
这是否意味着有一种方法可以在PMML模型中生成转换,从而能够将多行输入数据折叠成一行预测?我找不到这样一个例子(或者任何例子),而this post指出PMML中只支持单数行操作
进一步搜索,Sklearn2PMML库有一个“聚合器”方法,但这只在一行中生成一个转换,就像从两列中获取平均值一样
此代码:
iris_pipeline = PMMLPipeline([
("mapper", DataFrameMapper([
(["Sepal.Length", "Petal.Length"], [ContinuousDomain(), Aggregator(function = "mean")]),
])),
])
能够生成一个简单的转换,而不是聚合函数
<TransformationDictionary>
<DerivedField name="avg(Sepal.Length, Petal.Length)" optype="continuous" dataType="double">
<Apply function="avg">
<FieldRef field="Sepal.Length"/>
<FieldRef field="Petal.Length"/>
</Apply>
</DerivedField>
</TransformationDictionary>
TL;博士:
我希望实现的目标示例:
在PMML模型中有什么方法可以做到这一点,或者在应用数据进行预测之前,我应该尝试生成这样的预处理操作吗
不是设计的——PMML标准是关于表示统计和数据挖掘模型,而不是ETL
也许还有另一个ETL标准,它可以与PMML结合,形成一个包罗万象的数据应用程序
相关问题 更多 >
编程相关推荐