2024-09-25 10:30:48 发布
网友
我有一个装满twitter数据的数据框。这些列是:
因此,对于每一条tweet,我都有它在数据帧中的行id,tweet的内容,tweet中使用的提及(例如:“@foo”)作为字符串数组,以及我根据tweet的内容计算的值。你知道吗
行的示例如下:
所以我需要一种方法来做以下三件事:
如果有人能帮我解决这个问题,或者给我指出正确的方向,那就太好了。你知道吗
让我们称您的数据帧为df。你知道吗
对于您使用的第一个任务:
result = df[(Dataframe(df['mentions'].tolist()) == '@foo').any(1)]
在这里,Dataframe(df['mentions'])创建了一个新的数据帧,其中每一列是一个提,每一行是一个tweet。你知道吗
Dataframe(df['mentions'])
然后== '@foo'生成一个包含True的布尔数据帧,其中提到的是'@foo'。你知道吗
== '@foo'
最后.any(1)返回一个布尔索引,如果行中的任何元素为真,则返回该元素为真。你知道吗
.any(1)
我想有了这个帮助你可以自己解决剩下的问题。你知道吗
让我们称您的数据帧为df。你知道吗
对于您使用的第一个任务:
在这里,
Dataframe(df['mentions'])
创建了一个新的数据帧,其中每一列是一个提,每一行是一个tweet。你知道吗然后
== '@foo'
生成一个包含True的布尔数据帧,其中提到的是'@foo'。你知道吗最后
.any(1)
返回一个布尔索引,如果行中的任何元素为真,则返回该元素为真。你知道吗我想有了这个帮助你可以自己解决剩下的问题。你知道吗
相关问题 更多 >
编程相关推荐