我有一个带有列值的dataframe字典列表,如下所示:
id comments
1 [{review:{review_id: 8987, review_text: 'wonderful'}, {review:{review_id: 8988, review_text: 'good'}]
2 [{review:{review_id: 9098, review_text: 'not good'}, {review:{review_id: 9895, review_text: 'terrible'}]
我通过以下操作找到了如何展平特定的comments
:
pd.io.json.json_normalize(json.loads(df['comments'].iloc[0].replace("'", '"')))
它从列值生成一个新的数据帧。这很好,但我实际上需要做的是id
扩展,就像这样:
id review_id review_text
1 8987 wonderful
1 8988 good
2 9098 not good
2 9895 terrible
请注意id
随评论一起扩展。如何实现此问题的解决方案
作为参考,这里是数据集的一个小样本:https://aimedu-my.sharepoint.com/:x:/g/personal/matthewromero_msds2021_aim_edu/EfhdrrlYJy1KmGWhECf91goB7jpHuPFKyz8L3UTfyCSDiA?e=pYcap3
根据您提供的文件和您希望得到的结果,您可以尝试以下代码:
新的数据帧如下所示:
相关问题 更多 >
编程相关推荐