PMML模型是否允许基于多行数据(例如,通过聚合)的单一预测?

2024-05-19 18:48:52 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在寻找一种在PMML模型中应用一些聚合方法的方法(没有具体的示例,只是想看看是否可行)

PMML Transformations page的文档中有一段关于聚合的文章,定义为应用六个函数的方法:计数、求和、平均、最小、最大和多集

Aggregate

这是否意味着有一种方法可以在PMML模型中生成转换,从而能够将多行输入数据折叠成一行预测?我找不到这样一个例子(或者任何例子),而this post指出PMML中只支持单数行操作

进一步搜索,Sklearn2PMML库有一个“聚合器”方法,但这只在一行中生成一个转换,就像从两列中获取平均值一样

此代码:

iris_pipeline = PMMLPipeline([
    ("mapper", DataFrameMapper([
        (["Sepal.Length", "Petal.Length"], [ContinuousDomain(), Aggregator(function = "mean")]),
    ])),
])

能够生成一个简单的转换,而不是聚合函数

<TransformationDictionary>
    <DerivedField name="avg(Sepal.Length, Petal.Length)" optype="continuous" dataType="double">
        <Apply function="avg">
            <FieldRef field="Sepal.Length"/>
            <FieldRef field="Petal.Length"/>
        </Apply>
    </DerivedField>
</TransformationDictionary>

TL;博士:

我希望实现的目标示例:

Example of what I would like to achieve

在PMML模型中有什么方法可以做到这一点,或者在应用数据进行预测之前,我应该尝试生成这样的预处理操作吗


Tags: 数据方法函数模型示例functionlength例子
1条回答
网友
1楼 · 发布于 2024-05-19 18:48:52

Do PMML Models allow for singular prediction based on multiple rows of data (f.e. by aggregation?)?

不是设计的——PMML标准是关于表示统计和数据挖掘模型,而不是ETL

也许还有另一个ETL标准,它可以与PMML结合,形成一个包罗万象的数据应用程序

相关问题 更多 >