Python中文
首页
教程
问答
标签
搜索
登录
注册
阿拉伯语文本在lxml输出中不仅显示为字符实体
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我的S005_179-205M-2格式<a href="https://drive.google.com/file/d/1nZVps_1_DJ1gt-UDQxSshIewKdKUMrj5/view?usp=sharing" rel="nofollow noreferrer">XML file</a>:</p> <pre><code><?xml version="1.0" encoding="UTF-8"?> <TEI xmlns="http://www.tei-c.org/ns/1.0" xml:base="http://example.org" xml:id="example_v1" > <teiHeader> <fileDesc> <titleStmt> <title>test</title> </titleStmt> <publicationStmt> <p>test</p> </publicationStmt> <sourceDesc> <p>test</p> </sourceDesc> </fileDesc> </teiHeader> <text xml:lang="ar"> <body> <div type="chapter" n="5" xml:lang="ar"> <div type="section" n="5.179"> <head type="30">الْقَوْلُ فِي تَأْوِيلِ قَوْلِهِ : <quote type="quran" n="5:74">أَفَلا يَتُوبُونَ إِلَى اللَّهِ وَيَسْتَغْفِرُونَهُ وَاللَّهُ غَفُورٌ رَحِيمٌ </quote></head> <p n="nothadith" ana="adyan kalam yes">يقول تعالى ذكره : أفلا يرجع هذان الفريقان <name role="organization">الكافران</name> ، القائل أحدهما : <quote type="quran" n="5:72">إِنَّ اللَّهَ هُوَ <name role="person">الْمَسِيحُ ابْنُ مَرْيَمَ</name> </quote> ، والآخر القائل : <quote type="quran" n="5:73">إِنَّ اللَّهَ ثَالِثُ ثَلاثَةٍ </quote> ، عما قالا من ذلك ، و ينيبان مما قالا ونطقا به من كفرهما ، ويسألان ربهما المغفرة مما قالا : <quote type="quran" n="5:74" >وَاللَّهُ غَفُورٌ </quote> ، لذنوب التائبين من خلقه ، المنيبين إلى <pb type="turki" n="8:582"/> طاعته بعد معصيتهم ، <quote type="quran" n="5:34">رَحِيمٌ </quote> بهم في قبوله توبتَهم ، ومراجعتَهم إلى ما يحب مما يكره ، فيصفح بذلك من فعلهم عما سلف من إجرامهم قبل ذلك . </p> </div> </div> </body> </text> </TEI> </code></pre> <p>通过以下命令读取文件:</p> <pre><code>from lxml import etree tree = etree.parse('S005_179-205M-2 formated.xml') </code></pre> <p>打印树</p> <pre><code>root = tree.getroot() print(etree.tostring(root)) </code></pre> <p>输出文件看起来像</p> <p><a href="https://i.stack.imgur.com/ykyiZ.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/ykyiZ.png" alt="Output of =etree.tostring(root)"/></a></p> <p>它应该用阿拉伯语打印。我已经检查过解析器没有读阿拉伯语。如何确保解析器使用Unicode进行解析</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您的解析器正在使用unicode进行解析,但<code>tostring</code>没有写入unicode</p> <p>使用<code>etree.tostring(root, encoding="unicode")</code>或<code>etree.tostring(root, encoding="utf-8")</code></p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何将Python中的列表复制到给定的目标中?
2 回答
如何将python中的列表插入SQL表
4 回答
如何将python中的列表转换为numpy数组以放入十位
7 回答
如何将python中的列表输入javascript?
6 回答
如何将python中的列表返回给dag?
2 回答
如何将Python中的列表项重新排列成成对的元组/列表?
5 回答
如何将Python中的初始化对象序列化为XML?
3 回答
如何将python中的十进制字符串转换为数字?
2 回答
如何将Python中的原始输入文本转换为Tkinter中的标签?
7 回答
如何将python中的反斜杠命令转换为在Linux上运行
7 回答
如何将python中的命令行参数转换为字典?
8 回答
如何将python中的图像值传递到kivy中的kv文件?
9 回答
如何将Python中的图像数组(枕头对象)上传到Google云
9 回答
如何将Python中的图像编码为Base64?
7 回答
如何将python中的图像调整为灰度低分辨率,如MNIST时尚数据?
3 回答
如何将python中的多个html输出保存到单个文件(或多个)中?
2 回答
如何将Python中的多个ifelse语句重构为一个函数?
9 回答
如何将Python中的多处理与Django结合使用,从xml文件创建数千个模型实例?
5 回答
如何将python中的多级API响应转换为dataframe
5 回答
如何将python中的多线程编程模型转换为异步/等待模型?
10 回答