我想得到最近一天的行,按时间的升序排列。
我得到的数据帧如下:
label uId adId operTime siteId slotId contentId netType
0 0 u147333631 3887 2019-03-30 15:01:55.617 10 30 2137 1
1 0 u146930169 1462 2019-03-31 09:51:15.275 3 32 1373 1
2 0 u139816523 2084 2019-03-27 08:10:41.769 10 30 2336 1
3 0 u106546472 1460 2019-03-31 08:51:41.085 3 32 1371 4
4 0 u106642861 2295 2019-03-27 22:58:03.679 3 32 2567 4
因为我在这个csv文件中有大约1亿行,所以不可能将所有这些都加载到我的电脑内存中。
因此,在读取此csv文件时,我希望以时间升序的方式获取最近一天的行。
例如,如果最近一天是2019-04-04,它将输出如下:
#this not a real data, just for examples.
label uId adId operTime siteId slotId contentId netType
0 0 u147336431 3887 2019-04-04 00:08:42.315 1 54 2427 2
1 0 u146933269 1462 2019-04-04 01:06:16.417 30 36 1343 6
2 0 u139536523 2084 2019-04-04 02:08:58.079 15 23 1536 7
3 0 u106663472 1460 2019-04-04 03:21:13.050 32 45 1352 2
4 0 u121642861 2295 2019-04-04 04:36:08.653 3 33 3267 4
有人能帮我吗?
非常感谢。
我假设你不能把整个文件读入内存,而且文件是随机排列的。您可以分块读取文件并遍历这些块。你知道吗
就像提到的@anky\u91一样,您可以使用sort_values函数。下面是一个简单的例子:
输出:
支持anky\u 91所说的,sort\u values()在这里会很有帮助。你知道吗
我认为您也可以在这里使用datetimeindex;如果文件足够大,这可能是必要的。你知道吗
相关问题 更多 >
编程相关推荐