回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我有一个用utf-8编码的波兰字符的文件。
我需要做的是玩弄文字。但使用split(“”)时,列表包含\xc5\x82或\u0142</p>
<pre><code>filename = 'patient.txt'
f = open(filename, 'r')
for line in f:
print line
print line.split(" ")
print unicode(line,encoding(line),errors='ignore').split(" ")
f.close()
</code></pre>
<p>结果:</p>
<pre><code> Pacjent lat 48 został przyjęty do Oddziału z powodu spadku tolerancji wysiłku i duszności.
['\xef\xbb\xbfPacjent', 'lat', '48', 'zosta\xc5\x82', 'przyj\xc4\x99ty', 'do', 'Oddzia\xc5\x82u', 'z', 'powodu', 'spadku', 'tolerancji', 'wysi\xc5\x82ku', 'i', 'duszno\xc5\x9bci.']
[u'Pacjent', u'lat', u'48', u'zosta\u0142', u'przyj\u0119ty', u'do', u'Oddzia\u0142u', u'z', u'powodu', u'spadku', u'tolerancji', u'wysi\u0142ku', u'i', u'duszno\u015bci.']
</code></pre>
<p>要在列表中包含波兰语字符,我需要做什么?有可能吗?你知道吗</p>
<p>问候<br/>
棘爪</p>