我有一个csv,它包含多个用一个dict填充的列。我想把这些dict提取出来,用它们的键生成列,用它们的值填充单元格,在缺少值的地方填充NaN。因此:
id attributes
0 255RSSSTCHL-QLTDGLZD-BLK {"color": "Black", "hardware": "Goldtone"}
1 C3ACCRDNFLP-QLTDS-S-BLK {"size": "Small", "color": "Black"}
变成:
^{pr2}$有几个列像'id'我希望在结果数据帧中保持不变,还有一些像'attributes'这样的列填充了dict,我想把这些列放大成列。为了便于说明,我把它们截短到上面的例子中。在
源数据源:
解决方案1:
^{pr2}$解决方案2:感谢@DYZ for the hint:
结果:
<000行:<2000行:
可以使用
converters
选项将字符串解析嵌入到pd.read_csv
调用中然后我们可以
^{pr2}$merge
遍历每一行的字典并将其转换为pd.DataFrame
。我将使用上面作为dmerge
导入的cytoolz.dicttoolz.merge
。在相关问题 更多 >
编程相关推荐