从大数据中获取犯罪“计数” - 问答 - Python中文网

从大数据中获取犯罪“计数”

2024-06-01 06:50:04 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

这是一个相当广泛的问题，因为我不能复制我尝试过的所有不同的东西。从纽约警察局的犯罪数据中：https://data.cityofnewyork.us/Public-Safety/NYPD-Complaint-Data-Historic/qgea-i56i

我试图遍历CMPLNT\u FR\u DT行（这是一个字符串，定义并转换为DateTime对象）

创建数据框并用值填充它，使其看起来如下所示：

[Date]                        [Borough]              [Crime Count]       
01-01-2014
...

...

...

12-31-2014

因此，示例行将如下所示：

05-23-2014   QUEENS     45

2014年5月23日，皇后区发生了45起犯罪。你知道吗

我对数据集进行了pickle处理，以加快处理时间。我正在使用python熊猫库。我的问题是，无论我如何努力获得犯罪记录，我似乎都无法迭代CMPLNT\u FR\u DT。我也不能使用set_value函数将NYPD\u历史数据框中的值设置为我的新数据框。此外，即使尝试使用.iterrows()对自治区事件进行计数，也会产生“Can only tuple index with a MultiIndex”错误。非常感谢您的帮助！你知道吗

Tags：数据 https data dt public fr us complaint

1条回答

网友

1楼 · 发布于 2024-06-01 06:50:04

现在似乎是使用groupby方法的好时机。您可以实现df.groupby(['CMPLNT_FR_DT', 'Borough']).count()，这将为您提供一个新的数据帧，其中包含具有相同日期和自治区的所有实例的计数，而不考虑日期的格式，只要它们都是相同的数据类型。你知道吗

作为一个额外的好处，这将比遍历整个数据帧快得多。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章