擅长:python、mysql、java
<p>好的,这就是我最后要做的(在将我的堆积df从一个系列转换回一个具有一个名为'Counts'列的df之后):</p>
<pre><code> d = {}
for i in df.index:
x = np.arange(0, df['Counts'].loc[i]) +1
d[i] = pd.DataFrame([[1]*len(x),], index= [i], columns = x)
d[i].index = pd.MultiIndex.from_tuples(r[i].index.get_level_values(0))
d[i] = d[i].stack()
z = pd.concat(d.values(), axis=0)
</code></pre>
<p>虽然这是可行的,但效率不是很高,当我尝试对10万行进行采样时,会出现内存错误。用这种方法处理一个大文件有什么建议吗?你知道吗</p>
<p>感谢所有提供答案的人。我欢迎你的反馈。你知道吗</p>