我有一系列的新闻,我想通过滚动窗口(例如,3天)对新闻进行分组,以便进行进一步的文本分析。在
数据如下:(在pandas dataframe中)
date news
0 2017-01-03 'textA'
1 2017-01-03 'textB'
2 2017-01-04 'textC'
3 2017-01-05 'textD'
4 2017-01-05 'textE'
5 2017-01-05 'textF'
6 2017-01-06 'textG'
7 2017-01-06 'textH'
8 2017-01-07 'textI'
我想迭代所有新闻使用3天滚动窗口。 有点像数据.groupby('date',rolling=3).apply(something)(我知道没有这样的语法,只是为了举例说明)
第一个应用操作将应用于以下数据(从2017-01-03到2017-01-05)。在
^{pr2}$相应的,本次第二次申请操作:(2017-01-04至2017-01-06)
^{3}$我知道我可以手动找到索引并进行切片。不过,我想知道是否有更方便的方法使用Python和Pandas特性来实现这一点。在
注:索引中的数据可能不是连续的天(可能有些天没有条目)
目前没有回答
相关问题 更多 >
编程相关推荐