我正在做一个Tweepy/Django/nltk项目,我有一个列表,可以更新搜索到的tweets。以下是我遇到的问题:
query = 'happy'
max_tweets=5
search_results = {}
sentiments = {}
sentilist = []
for status in tweepy.Cursor(api.search, q=query).items(max_tweets):
search_results[status.text] = unicode(status.text)
search_results[status.text] = search_results[status.text].replace('|', ' ')
search_results[status.text] = search_results[status.text].replace('\n', ' ')
print(senti.linearsvc10(status.text))
sentiments['tweet'] = unicode(search_results[status.text])
sentiments['sentiment'] = senti.linearsvc10(unicode(status.text))
sentilist.append(sentiments)
print('inloop sentiments')
print sentiments
print('inloop sentilist')
print sentilist
print('sentiments')
print sentiments
print('sentilist')
print sentilist
基本上,感情等于
{'tweet': 'Actual tweet here', 'sentiment': 'pos'}
因此,对于循环的每次运行,我希望将情感附加到列表中,因此在结束时,列表中将有5个不同的对象。但实际发生的是,对于每个附加到sentilist的对象,它会将列表中的每个项更改为最后一个附加的对象。例如,以下是个人情感对象:
{'tweet': 'tweet1', 'sentiment': 'pos'}
{'tweet': 'tweet2', 'sentiment': 'neg'}
{'tweet': 'tweet3', 'sentiment': 'neg'}
{'tweet': 'tweet4', 'sentiment': 'pos'}
{'tweet': 'tweet5', 'sentiment': 'neg'}
附加到列表时应为:
[{'tweet': 'tweet1', 'sentiment': 'pos'},
{'tweet': 'tweet2', 'sentiment': 'neg'},
{'tweet': 'tweet3', 'sentiment': 'neg'},
{'tweet': 'tweet4', 'sentiment': 'pos'},
{'tweet': 'tweet5', 'sentiment': 'neg'}]
但它却变成了:
[{'tweet': 'tweet5', 'sentiment': 'neg'},
{'tweet': 'tweet5', 'sentiment': 'neg'},
{'tweet': 'tweet5', 'sentiment': 'neg'},
{'tweet': 'tweet5', 'sentiment': 'neg'},
{'tweet': 'tweet5', 'sentiment': 'neg'}]
我的代码的其他部分工作,我觉得有一个简单的解决办法,但我仍然不能找出它。你知道吗
您需要在每个循环中创建一个新字典
sentiments
:一次又一次地重写同一个字典中的值,并在每个循环中附加同一个字典。因此,您可以在列表
sentilist
的所有条目中看到上一次字典更新的值。你知道吗相关问题 更多 >
编程相关推荐