在标记tweets时忽略“️”

2024-09-21 02:54:04 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在做一个twitter网络爬虫来进行情绪分析。 我遵循这个教程https://marcobonzanini.com/2015/03/23/mining-twitter-data-with-python-part-4-rugby-and-term-co-occurrences/。你知道吗

在本教程(第3部分)中,Marco教授如何在算法中使用停止变量忽略某些项。然而,当我开始收集tweet并尝试匹配共现矩阵时-其中包含术语x在同一tweet中出现的次数,而术语y-tweepy正在收集这个术语:'️'。我不知道这是什么在Unicode和我怎么可以忽略。你知道吗

我试过撇号,单右/左引号,这些似乎都不起作用。你知道吗

有什么想法吗?你知道吗


Tags: https网络comdatawith教程twitter爬虫

热门问题