我是python新手,需要帮助。 我有一个文件,想提取文本到另一个文件。在
输入文件如下所示:
<Datei Kennung="4bc78" Titel="Morgen 1" Bereich="I847YP"> Morgen 1
Here is text, contains numbers and text.
Here is text, contains numbers and text.
Here is text, contains numbers and text.
Here is text, contains numbers and text.
Here is text, contains numbers and text.
</Datei>
<Datei Kennung="469" Titel="Trop Hall W " Bereich="izr"> Trop Hall W
Here is text, contains numbers and text.
Here is text, contains numbers and text.
</Datei>
对于文件的第一个区域,我需要输出文件Morgen 1.txt 包含以下内容:
^{pr2}$我从其他用户那里得到这个代码:
import re
REG_PARSE=re.compile(r'<Datei[^>]*Titel="\s*([^"]*?)\s*"[^>]*>\s*\1\s*(.*?</Datei>',re.dotall)
with open(filename) as infile:
for outfilename, text = REG_PARSE.finditer(infile.read()):
with open('%s.txt'%outfilename,'w') as outf:
outf.write(text)
但它不起作用
看看这对你是否有用:
如果您想要一种快速而肮脏的方法来完成此操作,而不使用xml(推荐),这将完成以下工作:
试试这个。。。它起作用了。。。在
相关问题 更多 >
编程相关推荐