如何在Python中迭代并解压“.gz”文件？

import zipfile zip_ref = zipfile.ZipFile('E:/echoverse/Subdivided Tweets/Subdivided Tweets/Tweets-0', 'r') zip_ref.extractall('E:/echoverse/Subdivided Tweets/Subdivided Tweets/Tweets-0/00_activities.json.gz%3FAWSAccessKeyId=AKIAJADH5KHBJMUZOPEA&Expires=1404665927&Signature=%2BdCn%252Ffn%2BFfRQhknWWcH%2BtnwlSfk%3D') zip_ref.close()

这是我的第三次尝试（没有运气）：

import gzip import json with gzip.open('E:/echoverse/Subdivided Tweets/Subdivided Tweets/Tweets-0/00_activities.json.gz%3FAWSAccessKeyId=AKIAJADH5KHBJMUZOPEA&Expires=1404665927&Signature=%2BdCn%252Ffn%2BFfRQhknWWcH%2BtnwlSfk%3D' , 'rb') as f: d = json.loads(f.read().decode("utf-8"))

stackover flow上还有另一个非常类似的威胁，但我的问题不同，我的压缩文件最初是JSON，当我使用最后一个方法时，我得到以下错误：出现异常：json.decoder.JSONDecodeError 期望值：行1列1（字符0）

1条回答

网友

1楼 · 发布于 2024-09-28 22:51:21

回答这个问题的简单脚本：它遍历，检查文件（fname）是否是gzip（通过magic number，因为我很愤世嫉俗）并解压缩它。在

import json
import gzip
import binascii
import os


def is_gz_file(filepath):
    with open(filepath, 'rb') as test_f:
        return binascii.hexlify(test_f.read(2)) == b'1f8b'


rootDir = '.'
for dirName, subdirList, fileList in os.walk(rootDir):
    for fname in fileList:
        filepath = os.path.join(dirName,fname)
        if is_gz_file(filepath):
            f = gzip.open(filepath, 'rb')
            json_content = json.loads(f.read())
            print(json_content)

经过测试而且有效。在

我也尝试过：

这是我的第三次尝试（没有运气）：

相关问题更多 >

编程相关推荐

热门问题

热门文章