我有一个XML
文档列表,其结构如下。我需要删除这行:
<!DOCTYPE pdf2xml SYSTEM "pdf2xml.dtd">
使用Python代码,因为手动删除它会非常耗时,因为有很多文件。你知道吗
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE pdf2xml SYSTEM "pdf2xml.dtd">
<pdf2xml producer="poppler" version="0.62.0">
<page number="1" position="absolute" top="0" left="0" height="1262" width="892">
</page>
</pdf2xml>
您可以逐行读取文件,然后将它们写回,而不需要文件中不需要的行。只要确定你要删除的内容-是不是就是你写的那一行?总是第二条线吗?是每一行吗?是第一行吗?等等
需要考虑的事项:
你真的需要/想要用Python吗?有更好的解决办法。例如,如果您使用的是Linux或Mac,则可以使用
sed
:首先,打开文件:
接下来,从文件中获取所有行:
现在可以关闭文件:
并以写入模式重新打开:
然后,写回你的行,除了你想删除的行。您可能需要将“\n”更改为文件结尾使用的任何行。你知道吗
最后,再次关闭文件。你知道吗
相关问题 更多 >
编程相关推荐