尝试读取一个.tsv文件,其中前几行包含与fi其余部分不同的字段量

2024-10-01 22:28:44 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在尝试读取一个包含大量数据的tsv文件,以便稍后使用python进行处理。问题是,这些tsv文件的前几行遵循的格式(我不知道如何表达)与实际数据不同。你知道吗

下面是我的意思的一个例子:

Name: Test 
Number: 213
LmaoIdk: Something else

Date   Measurement   Different_Measurement   Another_Measurement...
123    123           123                     123                ...
.
.
.

如何将这个tsv文件读入python,同时保留tsv文件中的所有信息?谢谢!你知道吗

当前,我正在尝试使用分隔符设置为“\t”的csv读取器来读取文件,如下所示:

raw_data = pd.read_csv(r'filename.tsv', delimiter = '\t')

但是,使用此方法会产生以下错误消息:

ParserError: Error tokenizing data. C error: Expected 2 fields in line 27, saw 527

期望的结果是将tsv文件读入我的代码,并存储在列表中。你知道吗


Tags: 文件csv数据nametestnumberdatadate
1条回答
网友
1楼 · 发布于 2024-10-01 22:28:44

如评论中所述,read\u csv中有一个skiprows选项:

raw_data = pd.read_csv(r'filename.tsv', skiprows = 4)

这将跳过文件中的前4行

编辑以读取前3行,您可以在两个单独的读取中执行此操作:

df1 = pd.read_csv(r'filename.tsv', nrows = 3, header = None, delimiter = ':')
df2 = pd.read_csv(r'filename.tsv', skiprows = 4)

df1型:

         0                1
0     Name             Test 
1   Number              213
2  LmaoIdk   Something else

df2型:

Date   Measurement   Different_Measurement   Another_Measurement
123    123           123                     123     

或者,您可以使用with open as方法读取前3行,并将这些行拆分为list/dict

相关问题 更多 >

    热门问题