擅长:python、mysql、java
<p>这里是一个使用<code>pandas</code>的解决方案。你知道吗</p>
<p>假设<code>master</code>是用<code>pandas</code>创建的主数据帧,您可以执行以下操作:</p>
<pre><code>shuffled = master.sample(frac=1)
</code></pre>
<p>这将创建一个主数据帧的副本,其中的行被随机重新排序。参见stackoverflow上的<a href="https://stackoverflow.com/a/34879805/10426037">this answer</a>或<a href="https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.sample.html" rel="nofollow noreferrer">the docs</a>中的<code>sample</code>方法。<br/>
然后,您可以简单地构建10个较小的数据帧,其中5行按顺序排列。你知道吗</p>
<pre><code>subsets = []
for i in range(10):
subdf = shuffled.iloc[(i*5):(i+1)*5]
subsets.append(subdf)
</code></pre>
<p><code>subsets</code>是包含小数据帧的列表。执行:</p>
<pre><code>for sub in subsets:
print(sub)
</code></pre>
<p>把它们全部打印出来,用肉眼确认没有重复。你知道吗</p>