我有以下数据帧:
updated_at type source
0 2017-01-01 User
1 2017-01-01 Inbound
2 2017-01-02 User
3 2017-01-02 Outbound
4 2017-01-03 Outbound
5 2017-01-03 User
我需要去掉type != User
所在的行,然后将type == User
所在行的源代码设置为要去掉的行的type
。到目前为止,我已经尝试过做groupby('updated_at)
,但是遇到了在副本上设置值的错误。而且,groupby('updated_at')
总是只返回两行。你知道吗
下面是我想要的结果:
updated_at type source
0 2017-01-01 User Inbound
2 2017-01-02 User Outbound
5 2017-01-03 User Outbound
注:我有37万排
如果确定目标行是连续的,可以使用
shift
:然后过滤出
type=="User"
编辑
因为这些线不是连续的,不像你的样本
这将保证一个时间戳类型总是(1)入站/出站(2)用户。 然后:
然后过滤出
type=="User"
拆分数据帧并使用相同的索引对其进行标准化。 然后从源代码中宣布源列
相关问题 更多 >
编程相关推荐