我想用python3为NLP流式传输twitter,我使用sublime text(IDLE是相同的结果),但是得到了很多非“utf-8”字符,如下所示:
\u0e40\u0e1b\u0e25\u0e35\u0e48\u0e22\u0e19\u0e08\u0e32\u0e01 NLP\u0e40\u0e1b\u0e47\u0e19 NPH(\u0e19\u0e31\u0e1e\u0e39\u0e14\u0e40\u0e2b\u0e35\u0e49\u0e22)\u0e40\u0e16\u0e2d\u0e40\u0e44\u0e2d\u0e49\u0e1b\u0e4a\u0e2d\u0e1b\u0e04\u0e04\u0e04\u0e4\u0e4\u0ee4\u0e4\u0e4\u0e4\u0e4\u0e4\u0e4\u0e4\u0e4\u0e4\u0e4\u0e4\u0e4\u0e0\u0e01\u0e48\u0e3\u0e3\u0e7\u0e3\u0e7\u0e7\u0e5\u0e5\u0e5\u0e4\u0e4\u0e4\u0e4\u0e4\u0e4\u0e4\u0e4\u0e4\e4\u0e4\u0e4\e4\u0e4\u0e4\u0e4\u0e4\e4\u0e4\\u0e2a\u0e31\u0e14\u0e21\u0e32\u0e2a\u0e40\u0e15\u0e2d\u0e23\u0e4c\u0e04\u0e27\u0e22\u0e44\u0e23\u0e21\u0e32\u0e2a\u0e40\u0e15\u0e2d\u0e23\u0e4c\u0e2d\u0e32\u0e23\u0e4c\u0e15\u0e2a\u0e35\u2026“
我的计划是:
from tweepy import Stream
from tweepy import OAuthHandler
from tweepy.streaming import StreamListener
import time
ckey=""
csecret=""
atoken=""
asecret=""
class listener(StreamListener):
def on_data(self, data):
try:
# print(data)
tweet=data.split(',')[3].split('"text":')[1].split(':')[1]
print(tweet)
saveThis=str(time.time())+'::'+tweet
saveFile=open('twitdb.csv','a')
saveFile.write(tweet)
# saveFile.write(data)
saveFile.write('\n')
saveFile.close()
return True
except BaseException as e:
print('failed ondata,',str(e))
time.sleep(5)
def on_error(self, status):
print(status)
auth = OAuthHandler(ckey, csecret)
auth.set_access_token(atoken, asecret)
twitterStream = Stream(auth, listener())
twitterStream.filter(track=["NLP"])
谁能帮我?谢谢
目前没有回答
相关问题 更多 >
编程相关推荐