python s3 Boto3从大文件中读取N行数/次迭代

2条回答

网友

1楼 · 编辑于 2024-05-19 22:46:38

那些正在寻找类似解决方案的人。我已经利用pandas库在循环中获得了N行

下面是我的代码实现，每次迭代将给出50行代码

for records in pd.read_json(obj['Body'].read().decode('utf-8'), lines=True, chunksize=50):
    print(records)

网友

2楼 · 编辑于 2024-05-19 22:46:38

也许smart_open会起作用

pip install smart_open[s3]

安装后

from smart_open import open

client = boto3.client("s3")
transport_params = {'client': client}
with open('s3://%s/%s' % (bucket_name, fname), 'wb', transport_params=transport_params, encoding='utf-8') as f:
    for line in f:
        print(json.loads(line))

您也可以使用iter_lines：

obj = s3.get_object(Bucket=bucket_name, Key=fname)
for line in obj['Body'].iter_lines(chunk_size=1024, keepends=False):
    print(json.loads(line))

编程相关推荐

java Spinner选定值未上载到firebase数据库
java如何通过bukkit中的配置添加消息？
java在SharedReference中保存列表的泛型类型
javascript Java小程序未定义
swt在Java中构建控制台应用程序
java OAuth同意屏幕没有突然显示，没有错误？
java webview选择文件安卓不工作
java Spring boot JPA如何从同一连接添加多个数据库？
java JDBC DB2驱动程序计时器线程处于阻塞状态
java我在vscode中运行flatter时看到一个错误在phone中运行应用程序somone能否帮助我plz

相关问题更多 >

编程相关推荐

热门问题

热门文章

python s3 Boto3从大文件中读取N行数/次迭代

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >