Python2.7使用多个xm

1条回答

网友

1楼 · 发布于 2024-06-26 01:33:25

如果较大的数字表示较旧的文件，则对文件列表进行排序，并将文件从最小的迭代到最大的文件（即，先读取最新的文件）。在

{Parse}你已经看到了文件，并且可以忽略后续文件。在

比如：

import glob
from datetime import datetime
from lxml import etree

def file_timestamp(filepath):
    """Return the timestamp from a file name"""
    filename = os.path.split(filepath)[1]
    filename = os.path.splitext(filename)[0]
    if '_' in filename:
        return filename.split('_')[1]
    return None

class Datafiles(object):
    def __init__(self, dir_path):
        self.date_cache = {}
        self.dir_path = dir_path

    def __iter__(self):
        return self.files()

    def next(self):
        return self.files().next()

    def files(self):
        filepaths = glob.glob(self.dir_path + '*_*.xml')
        filepaths = sorted(filepaths, key=file_timestamp)

        for filepath in filepaths:
            ## Parse data (xml)
            data = self.parse_file(filepath)
            ## If year/month is seen before, skip
            date = datetime.strptime(data['period'].text, '%m%Y')
            month = (date.year, date.month)
            if month in self.date_cache:
                continue

            ## Else store date and yield
            self.date_cache[month] = filepath
            yield data

    def parse_file(self, filepath):
        # YOUR XML PARSING HERE
        return etree.parse(filepath)

用法：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python2.7使用多个xm

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >