用python2.7打印阿拉伯语/波斯语字母

2024-09-28 03:12:24 发布

男 | 程序猿一只，喜欢编程写python代码。

在下面的代码中，Python似乎无法处理阿拉伯语字母。有什么想法吗？在

#!/usr/bin/python
# -*- coding: utf-8 -*-

import nltk
sentence = "ورود ممنوع"

tokens = nltk.word_tokenize(sentence)

print tokens

结果是：

^{pr2}$

我还试着在字符串前面添加一个u，但没用：

>>> u"ورود ممنوع">>>
['\xd9\x88\xd8\xb1\xd9\x88\xd8\xaf', '\xd9\x85\xd9\x85\xd9\x86\xd9\x88\xd8\xb9']

Tags：代码 import bin usr 字母 sentence utf word

1条回答

网友

1楼 · 发布于 2024-09-28 03:12:24

在包含字节字符串的列表中有正确的结果：

>>> lst = ['\xd9\x88\xd8\xb1\xd9\x88\xd8\xaf',
           '\xd9\x85\xd9\x85\xd9\x86\xd9\x88\xd8\xb9']
>>> for l in lst:
...  print l
... 
ورود
ممنوع

要将其转换为unicode，可以使用列表压缩：

^{pr2}$