有没有一种方法可以通过沿时间维度计算每个单元格的模式来聚合xarray数据数组?

2024-10-01 09:33:59 发布

您现在位置:Python中文网/ 问答频道 /正文

xarraypython包中,可以通过沿某个维度(通常沿时间维度)应用函数来减少DataArray的数据。内置函数包括平均值、最小值和最大值,即:

DataArray.mean(dim = 'time')
DataArray.min(dim = 'time')
DataArray.max(dim = 'time')

据我所知,没有内置的方法来以同样的方式计算模式。有没有别的办法,例如借助其他软件包的“帮助”?你知道吗

也就是说,一些功能相当于:

DataArray.mode(dim = 'time')

Tags: 数据方法函数time方式时间模式min
1条回答
网友
1楼 · 发布于 2024-10-01 09:33:59

可以使用Xarray的apply_ufunc包装Scipy的mode函数。有关如何使用apply_ufunc的更多示例,请参见here。你知道吗

def _mode(*args, **kwargs):
    vals = scipy.stats.mode(*args, **kwargs)
    # only return the mode (discard the count)
    return vals[0].squeeze()


def mode(obj, None):
    # note: apply always moves core dimensions to the end
    # usually axis is simply -1 but scipy's mode function doesn't seem to like that
    # this means that this version will only work for DataArray's (not Datasets)
    assert isinstance(obj, xr.DataArray)
    axis = obj.ndim - 1
    return xr.apply_ufunc(_mode, obj,
                          input_core_dims=[[dim]],
                          kwargs={'axis': axis})

使用xarray教程数据集的快速示例:

ds = xr.tutorial.load_dataset('air_temperature')

mode(ds, dim='time')

收益率:

<xarray.Dataset>
Dimensions:  (lat: 25, lon: 53)
Coordinates:
  * lat      (lat) float32 75.0 72.5 70.0 67.5 65.0 ... 25.0 22.5 20.0 17.5 15.0
  * lon      (lon) float32 200.0 202.5 205.0 207.5 ... 322.5 325.0 327.5 330.0
Data variables:
    air      (lat, lon) float32 271.5 272.4 272.5 272.1 ... 296.9 296.9 296.79

相关问题 更多 >