Pandas.read_csv(),如何将每个字符作为新元素读取

2024-10-04 01:32:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个巨大的文本文件(MyTextFile.txt),其中包含如下字符: (“\n”指线路断路器)

ABCDE\n
FGHIJ\n
KLMNO\n

使用pandas.read_csv('MyTextFile.txt')返回一个3x1数组,每个元素包含5个字符。 但是我需要一个15x1数组([a,B,C,D,E,F,G,H,I,J,K,L,M,N,O],应该忽略掉断线器),有没有一个简单的方法来实现这一点

一个文件中大约有2.5亿个字符,我有25个文件要读,所以这样做的效率对我来说非常关键

谢谢


Tags: 文件csvtxt元素pandasread数组字符
1条回答
网友
1楼 · 发布于 2024-10-04 01:32:29

您可以使用:

# Open the file
file = open('example.txt', 'r') 
# Create your results
res = []  

# Edited from https://www.geeksforgeeks.org/python-program-to-read-character-by-character-from-a-file/
while 1: 
    # read by character 
    char = file.read(1)           
    # If youre out of characters
    if not char:  
        break
    # If not, add the character to the list, but don't include breaking spaces
    elif char != '\n':
        res.append(char)

# Close your file object
file.close()

# Print out the results
print(res)

收益率: ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O']

相关问题 更多 >