我有大量的大型json文件要处理。 不幸的是,并非所有的json数据都结构良好。你知道吗
简而言之,数据的形状是
[ { A1:va1, B:[ {B1:vb1, ...}, {B2...}, {...} ] }, { A2 ....}, {....} ]
一个A
对象的数组,其中包含一个无对多B
对象的内部数组。你知道吗
不幸的是,在随机的情况下,给定的B
对象将有结构冲突。你知道吗
我想做的是在A
级别上迭代,但是强制将B
对象视为单个字符串,而不是由json.loads文件()-或-引起json.loads文件()将B
的每个实例视为一个字符串,以便我可以记录B
字符串以进行第一手检查。你知道吗
正如我所说的,上面的数据形状只是简单的。在真实的数据中,在顶层有很多含糊不清的事情发生,因为我认为我不能成功地定义一个模式并将其有效地应用于这个数据。至少在顶层没有任何结构冲突。你知道吗
问题是我可以用任何确定的方法检查数据。 在15分钟内,我用这种方法得到了答案;这不是我想要的答案,但至少我现在知道我要处理什么了。你知道吗
我用JSON格式化程序插件将一个文件加载到Notepad++中。 格式化后放到Excel表格里。添加了几个列和公式来指出感兴趣的行,几个Ctrl-F Find All和sorts。你知道吗
现在我最糟糕的情况就在眼前。但至少我现在知道了。你知道吗
相关问题 更多 >
编程相关推荐