填充列表时Python内存泄漏如何修复？

downloadsByExtensionCount = defaultdict(int) downloadsByExtensionList = [] logFiles = ['file1.log', 'file2.log', 'file3.log', 'file4.log'] for logFile in logFiles: log = open(logFile, 'r', encoding='utf-8') logLines = log.readlines() for logLine in logLines: date, time, c_ip, cs_method, s_port, cs_uri_stem, cs_user_agent = logLine.split(" ") downloadsByExtensionCount[cs_uri_stem] += 1 downloadsByExtensionList.append([date, time, c_ip, cs_method, s_port, cs_uri_stem, cs_user_agent])

3条回答

网友

1楼 · 编辑于 2024-10-03 19:32:31

您可以使用sqlite3内置模块进行数据操作。您还可以提供特殊名称“：memory:”insted“c:/temp/example”在RAM中创建数据库。如果不存储在RAM中，则限制硬盘的可用空间。在

import sqlite3
from collections import defaultdict

downloadsByExtensionCount = defaultdict(int)
# downloadsByExtensionList = []
logFiles = ['file1.log', 'file2.log', 'file3.log', 'file4.log']


conn = sqlite3.connect('c:/temp/example')
c = conn.cursor()
# Create table
c.execute('create table if not exists logs(date, time, c_ip, cs_method, s_port, cs_uri_stem, cs_user_agent)')

for logFile in logFiles:
    try:
        log = open(logFile, 'rb')#, encoding='utf-8')
    except IOError, e:
        continue

    logLines = log.readlines()

    for logLine in logLines:
        date, time, c_ip, cs_method, s_port, cs_uri_stem, cs_user_agent = logLine.split(" ")

        downloadsByExtensionCount[cs_uri_stem] += 1
        c.execute(
            'insert into logs(date, time, c_ip, cs_method, s_port, cs_uri_stem, cs_user_agent) values(?,?,?,?,?,?,?)', 
            (date, time, c_ip, cs_method, s_port, cs_uri_stem, cs_user_agent)
            )

conn.commit()
conn.close()

网友

2楼 · 编辑于 2024-10-03 19:32:31

log.readlines()将文件内容读入行列表中。可以直接遍历该文件以避免出现额外的列表。在

downloadsByExtensionCount = defaultdict(int)
downloadsByExtensionList = []
logFiles = ['file1.log', 'file2.log', 'file3.log', 'file4.log']


for logFile in logFiles:
    # closes the file after the block
    with open(logFile, 'r', encoding='utf-8') as log:
        # just iterate over the file
        for logLine in log:
            date, time, c_ip, cs_method, s_port, cs_uri_stem, cs_user_agent = logLine.split(" ")
            downloadsByExtensionCount[cs_uri_stem] += 1
            # tuples are enough to store the data
            downloadsByExtensionList.append((date, time, c_ip, cs_method, s_port, cs_uri_stem, cs_user_agent))

网友

3楼 · 编辑于 2024-10-03 19:32:31

直接迭代文件内容：

for logFile in logFiles:

    log = open(logFile, 'r', encoding='utf-8')
    for logLine in log:
        ...
    log.close()

使用tuple代替list：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章