擅长:python、mysql、java
<p>关键部分是不将每一行追加到循环中的数据帧。您希望将集合保存在一个list或dict容器中,然后一次连接所有这些集合。您还可以使用一个简单的返回默认值的<code>get</code>来简化<code>if/else</code>结构(例如。np.nan公司)如果在字典中找不到该项。在</p>
<pre><code>with open (path/to/file) as f:
d = {'group': [], 'id': [], 'Father': [], 'Mother': []}
for chunk in f:
jfile = json.loads(chunk)
d['groupe'].append(jfile['location'].get('groupe', np.nan))
d['id'].append(jfile.get('id', np.nan))
d['MotherName'].append(jfile['Mother'].get('MotherName', np.nan))
d['FatherName'].append(jfile['Father'].get('FatherName', np.nan))
df = pd.DataFrame(d)
</code></pre>