合并多个组id以形成一个合并的组id？问题的回答

合并多个组id以形成一个合并的组id？

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

<p>您需要将值转换为<code>tuples</code>，然后使用<a href="http://pandas.pydata.org/pandas-docs/stable/generated/pandas.factorize.html" rel="nofollow noreferrer">^{<cd2>}</a>：</p> <pre><code>df['consolidated_group_id'] = pd.factorize(df.apply(tuple,axis=1))[0] print (df) group_id sub_group_id consolidated_group_id 0 0 0 0 1 0 1 1 2 1 0 2 3 2 0 3 4 2 1 4 5 2 2 5 6 3 0 6 7 3 0 6 </code></pre> <p>Numpy解决方案有点修改<a href="https://stackoverflow.com/a/43167490/2901002">this answer</a>-通过<code>[::-1]</code>更改顺序，并通过<code>[0]</code>选择返回数组（<a href="https://docs.scipy.org/doc/numpy/reference/generated/numpy.unique.html" rel="nofollow noreferrer">^{<cd5>}</a>）：</p> <pre><code>a = df.values def unique_return_inverse_2D(a): # a is array a1D = a.dot(np.append((a.max(0)+1)[:0:-1].cumprod()[::-1],1)) return np.unique(a1D, return_inverse=1)[::-1][0] def unique_return_inverse_2D_viewbased(a): # a is array a = np.ascontiguousarray(a) void_dt = np.dtype((np.void, a.dtype.itemsize * np.prod(a.shape[1:]))) return np.unique(a.view(void_dt).ravel(), return_inverse=1)[::-1][0] df['consolidated_group_id'] = unique_return_inverse_2D(a) df['consolidated_group_id1'] = unique_return_inverse_2D_viewbased(a) print (df) group_id sub_group_id consolidated_group_id consolidated_group_id1 0 0 0 0 0 1 0 1 1 1 2 1 0 2 2 3 2 0 3 3 4 2 1 4 4 5 2 2 5 5 6 3 0 6 6 7 3 0 6 6 </code></pre>

合并多个组id以形成一个合并的组id？

1 个回答

相关Python问题