Python中文
首页
教程
问答
标签
搜索
登录
注册
仅在开始日期和结束日期之间按标识符对两列求和
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>假设我有以下几点:</p> <p>数据帧:</p> <pre><code>id enddate startdate ownerId value 1 2019-10-05 2019-10-05 10 105 2 2019-10-06 2019-10-05 10 240 3 2019-10-07 2019-10-05 10 420 4 2019-10-08 2019-10-08 10 470 5 2019-10-01 2019-10-01 11 320 6 2019-10-02 2019-10-01 11 18 7 2019-10-10 2019-10-10 12 50 8 2019-10-12 2019-10-10 12 412 9 2019-10-14 2019-10-10 12 398 10 2019-10-15 2019-10-12 12 320 </code></pre> <p>我要做的是对endId位于同一ownerId的当前startId和当前endId之间的所有“value”列求和</p> <p>输出应为:</p> <pre><code>id enddate startdate ownerId value output 1 2019-10-05 2019-10-05 10 105 105 # Nothing between 2019-10-05 and 2019-10-05 2 2019-10-06 2019-10-05 10 240 345 # Found 1 record (with id 1) 3 2019-10-07 2019-10-05 10 420 765 # Found 2 records (with id 1 and 2) 4 2019-10-08 2019-10-08 10 470 470 # Nothing else between 2019-10-08 and 2019-10-08 5 2019-10-01 2019-10-01 11 320 320 # Reset because Owner is different 6 2019-10-02 2019-10-01 11 18 338 # Found 1 record (with id 5) 7 2019-10-10 2019-10-10 12 50 50 # ... 8 2019-10-12 2019-10-10 12 412 462 9 2019-10-14 2019-10-10 12 398 860 10 2019-10-15 2019-10-12 12 320 1130 # Found 3 records between 2019-10-12 and 2019-10-15 (with id 8, 9 and 10) </code></pre> <p>我试图使用groupby.sum等,但我无法得到我需要的</p> <p>你有什么建议吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您可以在<strong>单个<strong>指令中执行:</p> <pre><code>df['output'] = df.apply(lambda row: df[df.ownerId.eq(row.ownerId) & df.enddate.between(row.startdate, row.enddate)] .value.sum(), axis=1) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么在使用strptime时会出现未进行转换的数据错误?
3 回答
为什么在使用strptim时会出现这个datetime日期错误
6 回答
为什么在使用StyleFrame时索引列的标题不显示sf.至excel()?
8 回答
为什么在使用sum()函数时会发生“int”对象不可调用的错误?
5 回答
为什么在使用sympy.dsolve时会得到“'list'对象没有属性'func'”?
5 回答
为什么在使用tabla时会得到一个空的数据帧?
7 回答
为什么在使用tensorboard时需要add_graph()的第二个参数?
1 回答
为什么在使用TensorFlow Lite转换YOLOv4时,推断时间/大小没有改进?有什么可能的改进吗?
5 回答
为什么在使用Tensorflow加载训练批时会出现内存泄漏?
6 回答
为什么在使用tensorflow时会收到警告/错误(使用函数API,但未实现错误)
5 回答
为什么在使用tetpyclient发出POST请求时出现403错误?
4 回答
为什么在使用TextBlob时会出现HTTP错误?
9 回答
为什么在使用TFIDF时出现错误“IndexError:list index out of range”pyspark.ml.feature?
8 回答
为什么在使用timedelta格式化之后,我在python中的日期是错误的?
8 回答
为什么在使用timeit或exec函数时,函数中的变量不会在提供的全局命名空间中搜索?
2 回答
为什么在使用tkinter时不能使用复选框?
2 回答
为什么在使用todoistpythonapi时会返回这个奇怪的ID?
3 回答
为什么在使用TQM时,在调整图像大小时,处理时间会有很大的差异?
3 回答
为什么在使用Tweepy下载用户时间线时收到错误消息
4 回答
为什么在使用twitter帐户登录Django应用程序时重定向127.0.0.1:8000?
8 回答