擅长:python、mysql、java
<p>如果您的姓名数量为>&燃气轮机;20并且您的姓名分布不会集中在不到20个姓名的范围内,那么不要使其过于复杂,只需这样做:</p>
<pre><code>number_of_unique_names_in_sample = 0
while number_of_unique_names_in_sample < 20:
df_sample = df.sample(n=10_000)
number_of_unique_names_in_sample = df_sample["Name"].nunique()
</code></pre>
<p>并且可能添加一个计数器来限制迭代次数,以防您的分布发生变化(例如在一个小测试样本中)</p>