将tweets下载到csv将用奇怪的unicode替换非字母数字字符

2024-10-01 09:27:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在将发送给用户的所有tweet下载到csv中

auth = tweepy.OAuthHandler(cons_tok, cons_sec)
auth.set_access_token(app_tok, app_sec)
twitter_api = tweepy.API(auth,retry_delay=5,retry_errors=set([401, 404, 500, 503]),
         wait_on_rate_limit=True )

#Open CSV
myfile = open('teststream.csv', 'w')
wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)

#Search for tweets sent to a particular user
search_results = tweepy.Cursor(twitter_api.search, q="@iamsrk").items(5)
try:
    for results in search_results:
        print(results.text)
        item = (results.text).encode('utf-8').strip()
        wr.writerow([item])

问题是csv包含一些奇怪的字符,我不知道如何修复它。你知道吗

对于tweet:

.@iamsrk’s breakout film #Baazigar also had this soothing romantic track

CSV中保存的数据如下:

RT @RadioMirchi: .@iamsrk’s breakout film #Baazigar also had this soothing romantic track …

如您所见,'正在被’s取代

我看到了其他非字母数字字符的一些更奇怪的替代品。我怎样才能解决这个问题?你知道吗


Tags: csvauthapiappsearchtwittersecresults