Python中文
首页
教程
问答
标签
搜索
登录
注册
Pandas:使用分组d创建滞后列
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>{cdm>使用以下内容:</p> <pre><code>url='https://raw.githubusercontent.com/108michael/ms_thesis/master/crsp.csv' df=pd.read_csv(url) df.head() feccandid fec.dyn feccf cid date_crsp catcode amtsum 0 S8VT00018 NaN NaN N00000534 2005 J2100 2.1 1 S8VT00018 NaN NaN N00000534 2005 L1200 5.0 2 S8VT00018 NaN NaN N00000534 2005 J7300 0.0 4 S8NM00127 0.561 0.382 N00015616 2006 G2900 2.5 5 S8NJ00350 -0.329 NaN N00000854 2005 LG000 7.5 </code></pre> <p>我想将<code>amtsum</code>值按年份延迟。下面的代码显示了我如何派生<code>amtsum</code>,并深入了解了我所期望的结果的性质:</p> ^{pr2}$ <p>我尝试使用以下代码获取滞后值:</p> <pre><code>crsp['amtsumlag.1']=crsp.groupby(['date_crsp','catcode', 'cid'])['amtsum'].shift(1) </code></pre> <p>这就回来了</p> <pre><code> feccandid fec.dyn feccf cid date_crsp catcode amtsum amtsumlag.1 0 S8VT00018 NaN NaN N00000534 2005 J2100 2.1 NaN 1 S8VT00018 NaN NaN N00000534 2005 L1200 5.0 NaN 2 S8VT00018 NaN NaN N00000534 2005 J7300 0.0 NaN 4 S8NM00127 0.561 0.382 N00015616 2006 G2900 2.5 NaN 5 S8NJ00350 -0.329 NaN N00000854 2005 LG000 7.5 NaN </code></pre> <p>由于我的<code>date_crsp</code>范围是从2005年到2014年,我预计2005年的范围是{<cd5>},但2006年不会。我也只选择了2005年以后的日期,得到了同样的结果。有人知道如何解决这个问题吗?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>如果您想将年份转换为一个,请准备一个新的年份列:</p> <pre><code>crsp['next_year'] = crsp['date_crsp'] + 1 </code></pre> <p>然后按<code>['next_year', 'catcode', 'cid']</code>而不是<code>['date_crsp', 'catcode', 'cid']</code>分组:</p> ^{pr2}$
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么在使用strptime时会出现未进行转换的数据错误?
6 回答
为什么在使用strptim时会出现这个datetime日期错误
2 回答
为什么在使用StyleFrame时索引列的标题不显示sf.至excel()?
2 回答
为什么在使用sum()函数时会发生“int”对象不可调用的错误?
2 回答
为什么在使用sympy.dsolve时会得到“'list'对象没有属性'func'”?
5 回答
为什么在使用tabla时会得到一个空的数据帧?
6 回答
为什么在使用tensorboard时需要add_graph()的第二个参数?
10 回答
为什么在使用TensorFlow Lite转换YOLOv4时,推断时间/大小没有改进?有什么可能的改进吗?
8 回答
为什么在使用Tensorflow加载训练批时会出现内存泄漏?
4 回答
为什么在使用tensorflow时会收到警告/错误(使用函数API,但未实现错误)
2 回答
为什么在使用tetpyclient发出POST请求时出现403错误?
3 回答
为什么在使用TextBlob时会出现HTTP错误?
10 回答
为什么在使用TFIDF时出现错误“IndexError:list index out of range”pyspark.ml.feature?
1 回答
为什么在使用timedelta格式化之后,我在python中的日期是错误的?
1 回答
为什么在使用timeit或exec函数时,函数中的变量不会在提供的全局命名空间中搜索?
3 回答
为什么在使用tkinter时不能使用复选框?
2 回答
为什么在使用todoistpythonapi时会返回这个奇怪的ID?
6 回答
为什么在使用TQM时,在调整图像大小时,处理时间会有很大的差异?
8 回答
为什么在使用Tweepy下载用户时间线时收到错误消息
2 回答
为什么在使用twitter帐户登录Django应用程序时重定向127.0.0.1:8000?
2 回答