这是一个相当广泛的问题,因为我不能复制我尝试过的所有不同的东西。从纽约警察局的犯罪数据中:https://data.cityofnewyork.us/Public-Safety/NYPD-Complaint-Data-Historic/qgea-i56i
我试图遍历CMPLNT\u FR\u DT行(这是一个字符串,定义并转换为DateTime对象)
创建数据框并用值填充它,使其看起来如下所示:
[Date] [Borough] [Crime Count]
01-01-2014
...
...
...
12-31-2014
因此,示例行将如下所示:
05-23-2014 QUEENS 45
2014年5月23日,皇后区发生了45起犯罪。你知道吗
我对数据集进行了pickle处理,以加快处理时间。我正在使用python熊猫库。我的问题是,无论我如何努力获得犯罪记录,我似乎都无法迭代CMPLNT\u FR\u DT。我也不能使用set_value
函数将NYPD\u历史数据框中的值设置为我的新数据框。此外,即使尝试使用.iterrows()
对自治区事件进行计数,也会产生“Can only tuple index with a MultiIndex”错误。非常感谢您的帮助!你知道吗
现在似乎是使用groupby方法的好时机。您可以实现
df.groupby(['CMPLNT_FR_DT', 'Borough']).count()
,这将为您提供一个新的数据帧,其中包含具有相同日期和自治区的所有实例的计数,而不考虑日期的格式,只要它们都是相同的数据类型。你知道吗作为一个额外的好处,这将比遍历整个数据帧快得多。你知道吗
相关问题 更多 >
编程相关推荐