用python2.7打印阿拉伯语/波斯语字母

2024-09-28 03:12:24 发布

您现在位置:Python中文网/ 问答频道 /正文

在下面的代码中,Python似乎无法处理阿拉伯语字母。有什么想法吗?在

#!/usr/bin/python
# -*- coding: utf-8 -*-

import nltk
sentence = "ورود ممنوع"

tokens = nltk.word_tokenize(sentence)

print tokens

结果是:

^{pr2}$

我还试着在字符串前面添加一个u,但没用:

>>> u"ورود ممنوع">>>
['\xd9\x88\xd8\xb1\xd9\x88\xd8\xaf', '\xd9\x85\xd9\x85\xd9\x86\xd9\x88\xd8\xb9']

Tags: 代码importbinusr字母sentenceutfword
1条回答
网友
1楼 · 发布于 2024-09-28 03:12:24

在包含字节字符串的列表中有正确的结果:

>>> lst = ['\xd9\x88\xd8\xb1\xd9\x88\xd8\xaf',
           '\xd9\x85\xd9\x85\xd9\x86\xd9\x88\xd8\xb9']
>>> for l in lst:
...  print l
... 
ورود
ممنوع

要将其转换为unicode,可以使用列表压缩:

^{pr2}$

Printing Unicode Char inside a List

相关问题 更多 >

    热门问题