Pandas：压平树木结构问题的回答

Pandas：压平树木结构

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我有一个类别树，由以下内容表示 <pre><code>import pandas as pd asset_tree = [ {'id': 1, 'name': 'Linear Asset', 'parent_id': -1}, {'id': 2, 'name': 'Lateral', 'parent_id': 1}, {'id': 3, 'name': 'Main', 'parent_id': 1}, {'id': 4, 'name': 'Point Asset', 'parent_id': -1}, {'id': 5, 'name': 'Fountain', 'parent_id': 4}, {'id': 6, 'name': 'Hydrant', 'parent_id': 4} ] tree = pd.DataFrame(asset_tree) print(tree) </code></pre> 这给了我一个数据帧，如下所示： <pre><code> id name parent_id 0 1 Linear Asset -1 1 2 Lateral 1 2 3 Main 1 3 4 Point Asset -1 4 5 Fountain 4 5 6 Hydrant 4 </code></pre> 树中最高的节点的父节点id等于-1，因此该树可以用图形表示如下： <pre><code>Linear Asset | - Lateral | - Main Point Asset | - Fountain | - Hydrant </code></pre> 我需要生成以下数据帧 <pre><code> id name parent_id flat_name 0 1 Linear Asset -1 Linear Asset 1 2 Lateral 1 Linear Asset : Lateral 2 3 Main 1 Linear Asset : Main 3 4 Point Asset -1 Point Asset 4 5 Fountain 4 Point Asset : Fountain 5 6 Hydrant 4 Point Asset : Hydrant </code></pre> 树是动态生成的，可以有任意数量的级别，因此下面的树 <pre><code>asset_tree = [ {'id': 1, 'name': 'Linear Asset', 'parent_id': -1}, {'id': 2, 'name': 'Lateral', 'parent_id': 1}, {'id': 3, 'name': 'Main', 'parent_id': 1}, {'id': 4, 'name': 'Point Asset', 'parent_id': -1}, {'id': 5, 'name': 'Fountain', 'parent_id': 4}, {'id': 6, 'name': 'Hydrant', 'parent_id': 4}, {'id': 7, 'name': 'Steel', 'parent_id': 2}, {'id': 8, 'name': 'Plastic', 'parent_id': 2}, {'id': 9, 'name': 'Steel', 'parent_id': 3}, {'id': 10, 'name': 'Plastic', 'parent_id': 3} ] </code></pre> 应产生以下结果： <pre><code> id name parent_id flat_name 0 1 Linear Asset -1 Linear Asset 1 2 Lateral 1 Linear Asset : Lateral 2 3 Main 1 Linear Asset : Main 3 4 Point Asset -1 Point Asset 4 5 Fountain 4 Point Asset : Fountain 5 6 Hydrant 4 Point Asset : Hydrant 6 7 Steel 2 Linear Asset : Lateral : Steel 7 8 Plastic 2 Linear Asset : Lateral : Plastic 8 9 Steel 3 Linear Asset : Main : Steel 9 10 Plastic 3 Linear Asset : Main : Plastic </code></pre>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

这里有一个递归的<code>apply</code>函数来实现这一点。函数接受一个<code>id</code>并通过树返回其“路径”： <pre><code>def flatname(ID): row = df[df['id'] == ID].squeeze() if row['parent_id'] == -1: return row['name'] else: return flatname(row['parent_id']) + ' : ' + row['name'] </code></pre> 要使用，请致电： <pre><code>df['flat_name'] = df['id'].apply(flatname) </code></pre> 在第二个示例中使用后的<code>df</code>： <pre><code> id name parent_id flat_name 0 1 Linear Asset -1 Linear Asset 1 2 Lateral 1 Linear Asset : Lateral 2 3 Main 1 Linear Asset : Main 3 4 Point Asset -1 Point Asset 4 5 Fountain 4 Point Asset : Fountain 5 6 Hydrant 4 Point Asset : Hydrant 6 7 Steel 2 Linear Asset : Lateral : Steel 7 8 Plastic 2 Linear Asset : Lateral : Plastic 8 9 Steel 3 Linear Asset : Main : Steel 9 10 Plastic 3 Linear Asset : Main : Plastic </code></pre> <hr/> OP注意到上面的函数显式地引用了在函数范围之外定义的<code>df</code>变量。因此，如果您将数据帧称为不同的名称，或者您希望在许多数据帧上调用此名称，这可能会导致问题。一种修复方法是将<code>apply</code>函数转变为更像私人助手的函数，并创建一个调用它的外部（更用户友好）函数： <pre><code>def _flatname_recurse(ID, df): row = df[df['id'] == ID].squeeze() if row['parent_id'] == -1: return row['name'] else: return _flatname_recurse(row['parent_id'], df=df) + ' : ' + row['name'] # asset_df to specify we are looking for a specific kind of df def flatnames(asset_df): return asset_df['id'].apply(_flatname_recurse, df=asset_df) </code></pre> 然后致电： <pre><code>df['flat_name'] = flatnames(df) </code></pre> 另外，请注意，我曾经使用<code>row = df.iloc[ID - 1, :]</code>来标识行，这在本例中有效，但取决于<code>id</code>比索引大一<a href="https://stackoverflow.com/a/19599661/13386979">This approach</a>更一般

Pandas：压平树木结构

1 个回答

相关Python问题