此功能已作为熊猫20.1的一部分发布(在我生日当天:)
公关已经合并!在
似乎这个问题可能导致了re-opening the PR for IntervalIndex in pandas。在
我不再有这个问题了,因为我现在实际上在查询来自A
和{
我有两个数据帧。在
在dataframeA
中,两个整数列一起表示一个间隔。在
在dataframeB
中,一个整数列表示一个位置。在
我想做一种连接,这样就可以将点分配到它们所在的每个区间。在
间隔很少但偶尔会重叠。如果两个点都落在一个重叠点内,则应指定两个点。大约一半的点不会落在区间内,但几乎每个区间都至少有一个点在区间内。在
我最初打算从pandas中转储数据,并使用intervaltree或banyan或bx-python,但后来我遇到了这个gist。原来shoyer在那里的ideas shoyer从来没有把它变成熊猫,但它让我思考——在熊猫身上实现这一点可能是可能的,因为我希望这段代码尽可能快地运行,所以我宁愿在最后一刻才将数据从pandas中转储出去。我也觉得这是可能的,bins
和熊猫^{
可能有关联?Pandas DataFrame groupby overlapping intervals of variable length
此功能是作为熊猫20.1的一部分发布的
用pyranges回答,这基本上是熊猫撒上了生物信息学的糖。在
设置:
执行:
^{pr2}$相关问题 更多 >
编程相关推荐