在Python中读取列数可变的文本文件

2条回答

网友

1楼 · 编辑于 2024-09-30 16:31:18

这会产生大量数据（从695行到475行）。但那个文件无论如何都是垃圾。最好在它进入python之前对其进行预处理。在

[ins] In [20]: df = pd.read_csv("/tmp/file.txt", delim_whitespace=True, error_bad_lines=False, warn_bad_lines=False, header=None)                                                               

[ins] In [21]: df.shape                                                                                                                                                                         
Out[21]: (474, 82)

网友

2楼 · 编辑于 2024-09-30 16:31:18

您可以使用_io.TextIOWrapper方法readlines()从文件中创建一个嵌套的字符串列表系统（文件中的每一行对应一个子列表）。这就是熊猫建造DataFrame所需的全部资源：

import pandas as pd

with open('file.txt', 'r') as f:
    file_lines = f.readlines()

keymap =  pd.DataFrame([string.split('\t') for string in file_lines])

这就产生了：

^{pr2}$

我希望这有帮助！最好的！在

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Python中读取列数可变的文本文件

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >