如何从大文件中读取行分隔的JSON（逐行）

网友

1楼 · 编辑于 2024-10-05 14:28:21

这将适用于您提供的特定文件格式。如果格式更改，则需要更改分析行的方式。

{
    "key11": 11,
    "key12": 12
}
{
    "key21": 21,
    "key22": 22
}

只需逐行阅读，并在运行时构建JSON块：

with open(args.infile, 'r') as infile:

    # Variable for building our JSON block
    json_block = []

    for line in infile:

        # Add the line to our JSON block
        json_block.append(line)

        # Check whether we closed our JSON block
        if line.startswith('}'):

            # Do something with the JSON dictionary
            json_dict = json.loads(''.join(json_block))
            print(json_dict)

            # Start a new block
            json_block = []

如果您对解析一个非常大的JSON文件而不将所有内容保存到内存感兴趣，那么您应该查看JSON.load API中的object_hook或object_pairs_hook回调方法。

网友

2楼 · 编辑于 2024-10-05 14:28:21

此时只需读取每一行并构造一个json对象：

with open(file_path) as f:
    for line in f:
        j_content = json.loads(line)

这样，您就可以加载正确的完整json对象（前提是json值中的某个地方或json对象的中间没有\n），并且避免了内存问题，因为每个对象都是在需要时创建的。

还有一个答案

https://stackoverflow.com/a/7795029/671543

网友

3楼 · 编辑于 2024-10-05 14:28:21

contents = open(file_path, "r").read() 
data = [json.loads(str(item)) for item in contents.strip().split('\n')]

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从大文件中读取行分隔的JSON（逐行）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >