嗨,伙计们,我有关于regex的问题,我需要一些帮助。我的代码看起来像:
# -*- coding: utf-8 -*-
import re
WEEKDAYS = ["nedjelja", "utorak", "četvrtak", "ponedjeljak", "subota", "srijeda", "petak"]:
with open('natio_geo_channel.xml', 'r') as input_file, \
open('nat.xml', 'w') as output_file:
for line in input_file:
for x in WEEKDAYS
line = line.replace("<para>" + x, "<date>")
line = re.sub(r"<para>\d{0}", "<start>", line)
line = re.sub(r"<start>\d{2}\.\d{2}\s/\s/", "</start>", line)
output_file.write(line)
我的文件看起来像:
<para>nedjelja1. rujna 2013.</para>
<para>06.00 na hrvatskom Zona gradnje: Izgradnja zelenog Pekinga</para>
<para>Kineske nevolje sa zagađenjem problem su s globalnim posljedicama. Pratite ekipu zelenih inženjera koji grade energetski učinkoviti Peking.</para>
我所做的,我先用替换,然后去掉内德耶尔贾,没关系。 但我该怎么做:
<start>06:00<start><title>Zona gradnje</title><sub>Izgradnja zelenog Pekinga</sub>
从此<para>06.00 na hrvatskom Zona gradnje: Izgradnja zelenog Pekinga</para>
你能给我一些建议或想法吗?你知道吗
请试试这个:
如果这是你需要的,请告诉我。你知道吗
输出
用于从文件中读取行:
希望这有帮助。你知道吗
要转换此项:
对此:
请执行以下操作:
相关问题 更多 >
编程相关推荐