清除数据帧中的多个JSON

2024-05-20 02:03:15 发布

男 | 程序猿一只，喜欢编程写python代码。

我创建了一个数据框架，如下所示，其中包含JSON格式的国家：

df = pd.DataFrame([['matt', '''[{"c_id": "cn", "c_name": "China"}, {"c_id": "au", "c_name": "Australia"}]'''],
                   ['david', '''[{"c_id": "jp", "c_name": "Japan"}, {"c_id": "cn", "c_name": "China"},{"c_id": "au", "c_name": "Australia"}]'''],
                   ['john', '''[{"c_id": "br", "c_name": "Brazil"}, {"c_id": "ag", "c_name": "Argentina"}]''']],
                  columns =['person','countries'])

我希望输出如下，仅包含国家名称，用逗号分隔，并按字母顺序排序：

result = pd.DataFrame([['matt', 'Australia, China'],
                   ['david', 'Australia, China, Japan'],
                   ['john', 'Argentina, Brazil']],
                  columns =['person','countries'])

我尝试了几种方法，但都没有成功。我希望下面的代码能够适当地拆分JSON格式，但没有成功——也许是因为JSON在数据帧中是字符串格式的

result = pd.io.json.json_normalize(df, 'c_name')

1条回答

网友

1楼 · 发布于 2024-05-20 02:03:15

一种解决方案是使用ast.literal_eval将字符串视为字典列表：

import ast

df["countries"] = df["countries"].map(lambda x: ast.literal_eval(x))
df["countries"] = df["countries"].map(lambda x: sorted([c["c_name"] for c in x]))

清除数据帧中的多个JSON

相关问题更多 >

编程相关推荐

热门问题

热门文章

清除数据帧中的多个JSON

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >