尝试将多个文本文件读入单个pandas datafram时发生filenotfound错误

2024-10-03 17:28:53 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图从一个本地目录将多个文本文件读入一个pandas数据帧。因为原始文本文件带有额外的文件扩展名,所以我重新命名了它,然后我试图通过read_csv和{}将所有文本文件读入单个数据框。问题是,我可以用pandas读取单个文本文件,但当我试图将本地目录中的文本文件列表读入单个数据帧时,出现以下错误:

folder = 'fakeNewsDatasets[Rada]/fakeNewsDataset/fake'
allfiles=os.listdir(folder)
print(allfiles)

['biz01.txt',
 'biz02.txt',
 'biz03.txt',
 'biz04.txt',
 'biz05.txt',
 'biz06.txt']

然后我尝试将这些文本文件读入单个数据帧,如下所示:

^{pr2}$

FileNotFoundError: [Errno 2] File b'biz02.txt' does not exist: b'biz02.txt' *

我不明白为什么会出现这个问题,因为将一个文本文件读入pandas dataframe对我来说很好。在

df = pd.read_csv('biz01.txt', header = None, sep = '\n', skip_blank_lines = True)
df=df.T
df.columns = ['headline', 'text']

有人能帮我解决这个问题吗?如何修复此错误?有更好的主意吗?在


Tags: 文件csv数据目录txtpandasdfread
1条回答
网友
1楼 · 发布于 2024-10-03 17:28:53

使用glob()这会更容易:

import glob
allfiles=glob.glob('C:\\folder1\\*.csv')

否则,在读取pd.read_csv()中的文件时,您可能必须在执行for file in allfiles时用file连接路径

相关问题 更多 >