Pandas read_fwf似乎不尊重编码参数

import pandas as pd fwf_widths = [6,2,6,2,14,1,40,1,10,1,10,1,1,3,3,1,1,1,2,1,5,1,10, 1,10,1,30,2,30,1,18,1,2,1,5,1,2,1,2,3,3,1,1,1,2,1, 5,1,10,1,10,1,30,2,30,1,18,1,2,1,5,1,2,1,2,3,1,1,1, 1,1,1,1,2,1,1,1,1,1,1,1,] pd.read_fwf("MOVEOUTA.ALL.OUT1.txt", usecols=range(0,80, 2), widths=fwf_widths, encoding='windows-1252', memory_map=True)

with open("MOVEOUTA.ALL.OUT1.txt", mode='r',encoding='windows-1252', ) as f: df = pd.read_fwf(f, usecols=range(0,80, 2), widths=fwf_widths, memory_map=True)

1条回答

网友

1楼 · 发布于 2024-10-01 13:34:39

我不知道pandas.read_fwf是否接受参数encoding：

pandas.read_fwf(filepath_or_buffer, colspecs='infer', widths=None, infer_nrows=100, **kwds)
Read a table of fixed-width formatted lines into DataFrame.
Also supports optionally iterating or breaking of the file into chunks.
Additional help can be found in the online docs for IO Tools.

以下代码段应该执行此任务（将StringIO的实例传递给filepath_or_buffer参数）：

import pandas as pd
from io import StringIO

with open("MOVEOUTA.ALL.OUT1.txt", mode='r', encoding='windows-1252') as f:
    content = f.read()
 
fwf_widths  = [6,2,6,2,14,1,40,1,10,1,10,1,1,3,3,1,1,1,2,1,5,1,10,
               1,10,1,30,2,30,1,18,1,2,1,5,1,2,1,2,3,3,1,1,1,2,1,
               5,1,10,1,10,1,30,2,30,1,18,1,2,1,5,1,2,1,2,3,1,1,1,
               1,1,1,1,2,1,1,1,1,1,1,1,]
df = pd.read_fwf( StringIO( content),
            usecols=range(0,80, 2),       # ??? this param not tested
            widths=fwf_widths,
            memory_map=True)

相关问题更多 >

编程相关推荐

热门问题

热门文章