嗨,我的代码是这样的(python3.3.2)
fw = codecs.open('outputfile.txt','w')
if((unidata[i]==U'\u0d46' and unidata[i-1]==U'\u0d28') and (unidata[i+1]==U'\u0d24') and (unidata[i+2]==U'\u0d4d')):
print ('code 1')
if(var==1):
x=unidata[0:i-1]+U'\u0d7b'+ ' + '+U'\u0d0e'+unidata[i+1:len(unidata)]
first_word=unidata[0:i-1]+U'\u0d7b'
fw.write(str(first_word.encode('UTF-8')))
文件中的输出如下:
^{pr2}$实际输出应为:
രാമൻ
如何解决这个问题?在
这很管用。。在
但我想你说的是文件中的字符串#### 是的,实际上,使用“”str()转换后,unicode将是这样的 “\xe0\xb4\xb0\xe0\xb4\xbe\xe0\xb4\xae\xe0\xb5\xbb”
这是unicode。但是要在马拉雅拉姆语中使用文本编辑器查看此内容,必须使用未编码模式打开 _如果使用python读取该文件,则必须打开该文件并将其编码为utf
示例: fr=打开(“我的文本.txt“,”r“) 数据=法语阅读() 独角数据=数据编码(“utf-8”) 打印unicodedata
这将印刷马拉雅拉姆语
unicode deconversion issues and solutions
我给了链接bc他们解释得比我能解释的更好,那里还有额外的函数定义,直接链接页面上的第3个我认为对你有帮助。在
相关问题 更多 >
编程相关推荐