<p>我有一个文本文件,其中包含一些波斯语文本,我想阅读该文件并计算出每个单词出现的次数,然后打印计算出的值。这是我的代码:</p>
<pre><code>f = open('C:/python programs/hafez.txt')
wordDict ={}
for line in f:
wordList = line.strip().split(' ')
for word in wordList:
if word not in wordDict:
wordDict[word] = 1
else: wordDict[word] = wordDict[word]+1
print((str(wordDict)))
</code></pre>
<p>它产生的结果有错误的编码格式,我尝试了各种方法来解决这个问题,但没有好的结果!以下是此代码生成的部分文本:</p>
<blockquote>
<p>{"\x00'\x063\x06(\x06": 3, "\x00,\x06'\x06E\x06G\x06": 16, "\x00'\x063\x06*\x06E\x06'\x069\x06": 1, '\x00-\x064\x061\x06': 1, .....} </p>
</blockquote>