使用python(\u0d35格式)将unicode数据转换为马拉雅拉姆语

2024-07-07 06:24:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我一直在为马拉雅拉姆新闻文章做主题建模。主题以unicode格式生成。输出如下:

u'0.021*"\u0d2a\u0d3f" + 0.021*"\u0d35\u0d3f\u0d36\u0d4d\u0d35\u0d02\u0d2d\u0d30\u0d28\u0d4d\u0d31\u0d46" + 0.021*"\u0d05\u0d26\u0d4d\u0d26\u0d47\u0d39\u0d02"'

我想把它转换成可读的字符串。每当涉及到文件操作时,它只在输出文件中显示相同的字符串。但我想要的结果是:

0.021*"പി" + 0.021*"വിശ്വംഭരന്റെ" + 0.021*"അദ്ദേഹം"

放入文件


Tags: 文件字符串主题格式文章unicode建模新闻
1条回答
网友
1楼 · 发布于 2024-07-07 06:24:59

对我来说似乎很好。。。确保你打印的终端支持它(好吧,屏幕截图不像我希望的那样可读。。。哦,好吧,如果你点击它(很好) enter image description here

如果你想把它写进一个文件,你可能需要把它编码成utf8

with open("some_file","wb") as f: 
    f.write(u'0.021*"\u0d2a\u0d3f" + 0.021*"\u0d35\u0d3f\u0d36\u0d4d\u0d35\u0d02\u0d2d\u0d30\u0d28\u0d4d\u0d31\u0d46" + 0.021*"\u0d05\u0d26\u0d4d\u0d26\u0d47\u0d39\u0d02"'.encode("utf-8"))

相关问题 更多 >