如何在xarray中按自定义时间范围分组？

import rioxarray as rio import xarray as xr import numpy as np from pathlib import Path from datetime import datetime all_scenes_f_et = Path('/home/serdp/rhone/rhone-ecostress/rasters/eeflux/PDR') all_pdr_et_paths = list(all_scenes_f_et.glob("*.tif")) def eeflux_path_date(path): year, month, day, _ = path.name.split("_") return datetime(int(year), int(month), int(day)) def open_eeflux(path, da_for_match): data_array = rio.open_rasterio(path) #chunks makes i lazyily executed data_array.rio.reproject_match(da_for_match) data_array = data_array.sel(band=1).drop("band") # gets rid of old coordinate dimension since we need bands to have unique coord ids data_array["date"] = eeflux_path_date(path) # makes a new coordinate return data_array.expand_dims({"date":1}) # makes this coordinate a dimension da_for_match = rio.open_rasterio(all_pdr_et_paths[0]) daily_eeflux_arrs = [open_eeflux(path, da_for_match) for path in all_pdr_et_paths] all_eeflux_arr = xr.concat(daily_eeflux_arrs, dim="date") all_eeflux_arr = all_eeflux_arr.sortby("date") ### not sure what should go here all_eeflux_arr.groupby(????????).integrate(dim="date", datetime_unit="D")

1条回答

网友

1楼 · 发布于 2024-10-01 17:33:37

最后，我编写了一个运行良好的函数。由于我的数据集并没有那么大，所以在遍历每个组的for循环中运行集成不会花费很长时间

def group_by_custom_doy(all_eeflux_arr, doy_start, doy_end):
    ey = max(all_eeflux_arr['date.year'].values)
    sy = min(all_eeflux_arr['date.year'].values)
    start_years = range(sy,ey)
    end_years = range(sy+1, ey+1)
    start_end_years = list(zip(start_year,end_year))
    water_year_arrs = []
    for water_year in start_end_years:
        start_mask = ((all_eeflux_arr['date.dayofyear'].values > doy_start) & (all_eeflux_arr['date.year'].values == water_year[0]))
        end_mask = ((all_eeflux_arr['date.dayofyear'].values < doy_end) & (all_eeflux_arr['date.year'].values == water_year[1]))
        water_year_arrs.append(all_eeflux_arr[start_mask | end_mask])
    return water_year_arrs

water_year_arrs = group_by_custom_doy(all_eeflux_arr, 125, 300)

我真的希望能够按任意时间段分组，开始时间和结束时间以一年中的某一天为单位。

相关问题更多 >

编程相关推荐

热门问题

热门文章