Python如何优化文件解析中的迭代器

import os, codecs, sys reload(sys) sys.setdefaultencoding('utf8') // to prevent cp-932 errors on screen file = "aud.csv" outfile = "access-2.csv" filelist = [] accesslist = [] with codecs.open(file,"r",'utf-8-sig') as infile: for line in infile: newline = line.split(',') folder = newline[0].replace("\"","") user = newline[1].replace("\"","") filelist.append(folder) accesslist.append(folder+","+user) newfl = sorted(set(filelist)) def makeFile(): print "Starting, please wait" for i in range(1,len(newfl)): searchItem = str(newfl[i]) with codecs.open(outfile,"a",'utf-8-sig') as output: outtext = ("\r\nFile access for: "+ searchItem + "\r\n") output.write(outtext) for item in accesslist: searchBreak = item.split(",") searchTarg = searchBreak[0] if searchItem == searchTarg: searchBreaknew = searchBreak[1].replace("FSA-INC01S\\","") searchBreaknew = str(searchBreaknew) # print(searchBreaknew) searchBreaknew = searchBreaknew.replace(" ",",") searchBreaknew = searchBreaknew.replace("CREATOR,OWNER","CREATOR OWNER") output.write(searchBreaknew)

import os, codecs, sys, csv reload(sys) sys.setdefaultencoding('utf8') file = "aud.csv" outfile = "access-3.csv" filelist = [] accesslist = [] with codecs.open(file,"r",'utf-8-sig') as csvinfile: auditfile = csv.reader(csvinfile, delimiter=",") for line in auditfile: folder = line[0] user = line[1].replace("FSA-INC01S\\","") filelist.append(folder) accesslist.append(folder+","+user) newfl = sorted(set(filelist)) def makeFile(): print "Starting, please wait" for i in xrange(1,len(newfl)): searchItem = str(newfl[i]) outtext = ("\r\nFile access for: "+ searchItem + "\r\n") accessUserlist = "" for item in accesslist: searchBreak = item.split(",") if searchItem == searchBreak[0]: searchBreaknew = str(searchBreak[1]).replace(" ",",") searchBreaknew = searchBreaknew.replace("R,O","R O") accessUserlist += searchBreaknew+"\r\n" with codecs.open(outfile,"a",'utf-8-sig') as output: output.write(outtext) output.write(accessUserlist)

1条回答

网友

1楼 · 发布于 2024-09-30 22:21:11

我被你用过的.csv文件扩展名误导了。
您给定的预期输出与csv不兼容，因为在记录中不可能\n。
建议使用生成器逐记录返回：

class Audit(object):
    def __init__(self, fieldnames):
        self.fieldnames = fieldnames
        self.__access = {}

    def append(self, row):
        folder = row[self.fieldnames[0]]
        access = row[self.fieldnames[1]].strip(' ')
        access = access.replace("FSA-INC01S\\", "")
        access = access.split(' ')
        if len(access) == 3:
            if access[0] == 'CREATOR':
                access[0] += ' ' + access[1]
                del access[1];
            elif access[1] == 'Full':
                access[1] += ' ' + access[2]
                del access[2];

        if folder not in self.__access:
            self.__access[folder] = []

        self.__access[folder].append(access)

    # Generator for class Audit
    def __iter__(self):
        record = ''
        for folder in sorted(self.__access):
            record = folder + '\n'
            for access in self.__access[folder]:
                record += '%s\n' % (','.join(access) )

            yield record + '\n'

如何使用：

def main():
    import io, csv
    audit = Audit(['Folder', 'Accesslist'])

    with io.open(file, "r", encoding='utf-8') as csc_in:
        for row in csv.DictReader(csc_in, delimiter=","):
            audit.append(row)

    with io.open(outfile, 'w', newline='', encoding='utf-8') as txt_out:
        for record in audit:
            txt_out.write(record)

测试Python:3.4.2-csv:1.0

相关问题更多 >

编程相关推荐

热门问题

热门文章