擅长:python、mysql、java
<p>您有一个行索引,并根据计数重复它,例如在R中,您可以执行以下操作:</p>
<pre><code>df[rep(1:nrow(df),df$cases),]
</code></pre>
<p>首先要获得像您这样的数据:</p>
<pre><code>df = pd.DataFrame({'x':[1,1,2,2,2,2],'y':[0,1,0,1,1,1]})
counts = df.groupby(['x','y']).size().reset_index()
counts.columns = ['x','y','n']
x y n
0 1 0 1
1 1 1 1
2 2 0 1
3 2 1 3
</code></pre>
<p>然后:</p>
<pre><code>counts.iloc[np.repeat(np.arange(len(counts)),counts.n),:2]
x y
0 1 0
1 1 1
2 2 0
3 2 1
3 2 1
3 2 1
</code></pre>