我想在“开始”列和“结束”列之间的时段内每个月进行分隔,这样我就可以使用pivot\u表使它们成为列:
subscription|values| start | end
x |1 |5/5/2018 |6/5/2018
y |2 |5/5/2018 |8/5/2018
z |1 |5/5/2018 |9/5/2018
a |3 |5/5/2018 |10/5/2018
b |4 |5/5/2018 |11/5/2018
c |2 |5/5/2018 |12/5/2018
期望输出:
subscription|jan| feb | mar | abr | jun | jul | aug | sep | out | nov | dez
x | | | | | 1 | 1 | | | | |
y | | | | | 2 | 2 | 2 | | | |
z | | | | | 1 | 1 | 1 | 1 | | |
a | | | | | 3 | 3 | 3 | 3 | 3 | |
b | | | | | 4 | 4 | 4 | 4 | 4 | 4 |
c | | | | | 2 | 2 | 2 | 2 | 2 | 2 | 2
使用简单的^{}
第一组以值开始,以
-values
结束然后
cumsum
到axis=1
df2=df2.cumsum(1)将final设置为
values
最终输出:
来自
sklearn
MultiLabelBinarizer
的方法相关问题 更多 >
编程相关推荐