如何将具有JSON值的文本文件转换为CSV

{"id": "testid1","title": "testtitle1","link": "testlink1","description": "testdes2","entities": ["en1", "en2"]} {"id": "testid2","title": "testtitle2","link": "testlink2","description": "testdes2","entities": [""]} {"id": "testid1","title": "testtitle1","link": "testlink1","description": "testdesc","entities": ["en1", "en2", "en3"]}

id title link description entities__001 entities__002 entities__003 testid1 testtitle1 testlink1 testdes2 en1 en2 testid2 testtitle2 testlink2 testdes2 testid1 testtitle1 testlink1 testdesc en1 en2 en3

1条回答

网友

1楼 · 发布于 2024-09-26 18:06:01

首先读取文件并处理数据（从字符串转换为json）

import json
with open(r".\data_file.txt") as f:
    data = f.readlines()
processed_data = [json.loads(line) for line in data]

然后在文档上迭代以添加新字段（以展平数据）。有更有效的方法，但这是可行的

import pandas as pd
for document in processed_data:
    for i in range(len(document["entities"])):
        document["entities_{}".format(i+1)] = document["entities"][i]
df = pd.DataFrame(processed_data)
#remove original column (if needed)
del df["entities"]

然后保存为csv

df.to_csv(r"./out_folder/out_data.csv")

相关问题更多 >

编程相关推荐

热门问题

热门文章