尝试读取一个.tsv文件，其中前几行包含与fi其余部分不同的字段量 - 问答 - Python中文网

尝试读取一个.tsv文件，其中前几行包含与fi其余部分不同的字段量

2024-10-01 22:28:44 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我目前正在尝试读取一个包含大量数据的tsv文件，以便稍后使用python进行处理。问题是，这些tsv文件的前几行遵循的格式（我不知道如何表达）与实际数据不同。你知道吗

下面是我的意思的一个例子：

Name: Test 
Number: 213
LmaoIdk: Something else

Date   Measurement   Different_Measurement   Another_Measurement...
123    123           123                     123                ...
.
.
.

如何将这个tsv文件读入python，同时保留tsv文件中的所有信息？谢谢！你知道吗

当前，我正在尝试使用分隔符设置为“\t”的csv读取器来读取文件，如下所示：

raw_data = pd.read_csv(r'filename.tsv', delimiter = '\t')

但是，使用此方法会产生以下错误消息：

ParserError: Error tokenizing data. C error: Expected 2 fields in line 27, saw 527

期望的结果是将tsv文件读入我的代码，并存储在列表中。你知道吗

Tags：文件 csv 数据 name test number data date

1条回答

网友

1楼 · 发布于 2024-10-01 22:28:44

如评论中所述，read\u csv中有一个skiprows选项：

raw_data = pd.read_csv(r'filename.tsv', skiprows = 4)

这将跳过文件中的前4行

编辑以读取前3行，您可以在两个单独的读取中执行此操作：

df1 = pd.read_csv(r'filename.tsv', nrows = 3, header = None, delimiter = ':')
df2 = pd.read_csv(r'filename.tsv', skiprows = 4)

df1型：

         0                1
0     Name             Test 
1   Number              213
2  LmaoIdk   Something else

df2型：

Date   Measurement   Different_Measurement   Another_Measurement
123    123           123                     123

或者，您可以使用with open as方法读取前3行，并将这些行拆分为list/dict

相关问题更多 >

编程相关推荐

热门问题

热门文章