擅长:python、mysql、java
<p>可以使用<a href="https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.core.groupby.DataFrameGroupBy.sample.html" rel="nofollow noreferrer">DataFrameGroupBy.sample</a>对每个类别中的行进行采样</p>
<pre><code>n = 0.2 # 20% per category
# Sample dataframe
df = pandas.DataFrame({
'image_id': [1,2,3,4,5,6,7],
'product_category': ['A', 'A', 'A', 'A', 'A', 'B', 'B']
})
df.groupby('product_category').sample(frac=n)
</code></pre>
<p>但是,请注意,如果抽样计数低于1,则某些类别可能不会返回任何行</p>