字典有一个单独的字典，我想在python的dataframe中对其进行转换，以便表中包含具有子列的列问题的回答

字典有一个单独的字典，我想在python的dataframe中对其进行转换，以便表中包含具有子列的列

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

<code>pandas</code>实际上不支持“子列”，正如您所要求的那样。不过，它确实支持以<code>{'a': {'b': 'value'}}</code>为您提供列<code>a.b = 'value'</code>的方式展平<code>json</code>对象。执行此操作的官方方法是<code>json_normalize</code>，并将像这样使用 <pre class="lang-py prettyprint-override"><code>import pandas as pd income_statement_history = { "totalRevenue": { "raw": 67985000, "fmt": "67.98M", "longFmt": "67,985,000" }, "costOfRevenue": { "raw": 0, "fmt": 'null', "longFmt": "0" }, "grossProfit": { "raw": 67985000, "fmt": "67.98M", "longFmt": "67,985,000" }, "totalOperatingExpenses": { "raw": 46790000, "fmt": "46.79M", "longFmt": "46,790,000" }, "operatingIncome": { "raw": 21195000, "fmt": "21.2M", "longFmt": "21,195,000" } } df = pd.json_normalize(income_statement_history) </code></pre> 印刷<code>df</code>会给你 <pre class="lang-py prettyprint-override"><code>>>> df totalRevenue.raw totalRevenue.fmt totalRevenue.longFmt costOfRevenue.raw costOfRevenue.fmt ... totalOperatingExpenses.fmt totalOperatingExpenses.longFmt operatingIncome.raw operatingIncome.fmt operatingIncome.longFmt 0 67985000 67.98M 67,985,000 0 null ... 46.79M 46,790,000 21195000 21.2M 21,195,000 [1 rows x 15 columns] </code></pre> 您可以继续使用动态访问这些列值 <pre class="lang-py prettyprint-override"><code>>>> col = 'totalOperatingExpenses' >>> subcol = 'longFmt' >>> df[f'{col}.{subcol}'] 0 46,790,000 Name: totalOperatingExpenses.longFmt, dtype: object </code></pre> <hr/> 根据@Ann Zen的回答，可以选择<code>pd.DataFrame</code>初始化，也可以选择您一直使用的任何方法，这取决于您的确切需求 您的目标是基于json数据的列的直观处理吗？您的目标是否是访问给定子列名称和基列名称的子列的明确方式？我能想到的大多数答案都是基于偏好的，差别很小

字典有一个单独的字典，我想在python的dataframe中对其进行转换，以便表中包含具有子列的列

1 个回答

相关Python问题