Pandas群乘秋风

2024-10-05 10:59:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一系列的新闻,我想通过滚动窗口(例如,3天)对新闻进行分组,以便进行进一步的文本分析。在

数据如下:(在pandas dataframe中)

        date      news
0    2017-01-03  'textA'
1    2017-01-03  'textB'
2    2017-01-04  'textC'
3    2017-01-05  'textD'
4    2017-01-05  'textE'
5    2017-01-05  'textF'
6    2017-01-06  'textG'
7    2017-01-06  'textH'
8    2017-01-07  'textI'

我想迭代所有新闻使用3天滚动窗口。 有点像数据.groupby('date',rolling=3).apply(something)(我知道没有这样的语法,只是为了举例说明)

第一个应用操作将应用于以下数据(从2017-01-03到2017-01-05)。在

^{pr2}$

相应的,本次第二次申请操作:(2017-01-04至2017-01-06)

^{3}$

我知道我可以手动找到索引并进行切片。不过,我想知道是否有更方便的方法使用Python和Pandas特性来实现这一点。在

注:索引中的数据可能不是连续的天(可能有些天没有条目)


Tags: 数据文本dataframepandasdate新闻newstexta

热门问题