我目前正在尝试读取一个包含大量数据的tsv文件,以便稍后使用python进行处理。问题是,这些tsv文件的前几行遵循的格式(我不知道如何表达)与实际数据不同。你知道吗
下面是我的意思的一个例子:
Name: Test
Number: 213
LmaoIdk: Something else
Date Measurement Different_Measurement Another_Measurement...
123 123 123 123 ...
.
.
.
如何将这个tsv文件读入python,同时保留tsv文件中的所有信息?谢谢!你知道吗
当前,我正在尝试使用分隔符设置为“\t”的csv读取器来读取文件,如下所示:
raw_data = pd.read_csv(r'filename.tsv', delimiter = '\t')
但是,使用此方法会产生以下错误消息:
ParserError: Error tokenizing data. C error: Expected 2 fields in line 27, saw 527
期望的结果是将tsv文件读入我的代码,并存储在列表中。你知道吗
如评论中所述,read\u csv中有一个skiprows选项:
这将跳过文件中的前4行
编辑以读取前3行,您可以在两个单独的读取中执行此操作:
df1型:
df2型:
或者,您可以使用with open as方法读取前3行,并将这些行拆分为list/dict
相关问题 更多 >
编程相关推荐