擅长:python、mysql、java
<p>看起来您试图在PDF文件中的所有词典中搜索“Lang”密钥。在</p>
<p>要检查PDF文件中的语言信息,您需要检查目录中的“Lang”条目。
然而,此条目的存在取决于用于创建PDF文件的PDF创建软件,而大多数PDF文件没有此条目。在</p>
<p>我不懂Python代码,但我相信您使用的PDF库将为您提供对trailer(dictionary)或catalog(root)dictionray的访问。如果您有权访问尾部dict,请从dict获取“Root”值。这是对目录(Root)字典的间接引用。然后将此引用解析为dict以获得目录字典。从这个目录dict获取/Lang值将为您提供属性。在</p>
<p>试试下面的方法</p>
<pre><code>catalog = pdfFile.trailer['/Root'].getObject()
if has_key("/Lang"):
lang = catalog['/Lang'].getObject()
</code></pre>
<p>请注意,我不是一个Python程序员,上面的代码片段是我的第一个Python代码(我不确定它是否有效)。:-)</p>
<p>请参考<a href="http://sourcecodebrowser.com/python-pypdf/1.10/classpy_pdf_1_1pdf_1_1_pdf_file_reader.html#a92be75503c895367083a846b3060e632" rel="nofollow">http://sourcecodebrowser.com/python-pypdf/1.10/classpy_pdf_1_1pdf_1_1_pdf_file_reader.html#a92be75503c895367083a846b3060e632</a>上的pypdf参考</p>