为什么将logger encoding设置为UTF8写UNIX行尾的文件？

import logging logger_dbg = logging.getLogger("dbg") logger_dbg.setLevel(logging.DEBUG) fh_dbg_log = logging.FileHandler('debug.log', mode='w', encoding='utf-8') fh_dbg_log.setLevel(logging.DEBUG) # Print time, logger-level and the call's location in a source file. formatter = logging.Formatter( '%(asctime)s-%(levelname)s(%(module)s:%(lineno)d) %(message)s', datefmt='%Y-%m-%d %H:%M:%S') fh_dbg_log.setFormatter(formatter) logger_dbg.addHandler(fh_dbg_log) logger_dbg.propagate = False

1条回答

网友

1楼 · 发布于 2024-10-05 14:24:15

指定编码时，^{}将被使用，而不是常规的open()调用。此函数总是以二进制模式打开文件，并在此基础上实现编码。这样它就可以保证任何编解码器都能工作，而不仅仅是基于ASCII的编解码器。这种选择的一个副作用是在Windows上新行不再被翻译成平台约定！在

您可以提交一个bug来修复这个问题，一个更好的解决方案是使用^{}；io模块是新的Python3 I/O框架，后移植到Python2，它可以更好地处理文本模式，包括在Windows上正确地处理换行。在

您可以修补logging.FileHandler._open方法来本地修复此问题：

import io
from logging import FileHandler

_orig_open = FileHandler._open
_orig_emit = FileHandler.emit

def filehandler_open_patch(self):
    if self.encoding is not None:
        return io.open(self.baseFilename, self.mode, encoding=self.encoding)
    return _orig_open(self)

def filehandler_emit_patch(self, record):
    if not self.encoding:
        return _orig_emit(self, record)
    try:
        msg = self.format(record)
        stream = self.stream
        fs = u"%s\n"
        if not isinstance(msg, unicode):
            msg = msg.decode('ASCII', 'replace')
        ufs = u'%s\n'
        stream.write(ufs % msg)
        self.flush()
    except (KeyboardInterrupt, SystemExit):
        raise
    except:
        self.handleError(record)

FileHandler._open = filehandler_open_patch
FileHandler.emit = filehandler_emit_patch

FileHandler.emit()方法也需要修补，否则Unicode消息首先被编码为UTF-8，但是io.open()文件对象只接受Unicode对象。在

相关问题更多 >

编程相关推荐

热门问题

热门文章