擅长:python、mysql、java
<p>我相信sklearn中的类不平衡问题可以通过使用<code>class_weight</code>参数部分解决。在</p>
<p>这个参数要么是一个字典,每个类都被分配了一个统一的权重,要么是一个字符串,告诉sklearn如何构建这个字典。例如,将此参数设置为“auto”,将按每个类的频率的倒数来加权。在</p>
<p>通过用更高的量来加权较少出现的类,你可以得到“更好”的结果。在</p>
<p>像<strong>SVM</strong>或<strong>logistic回归等分类器也提供了这个<code>class_weight</code>参数。在</p>
<p><a href="https://stackoverflow.com/a/26244744/2526441">This</a>堆栈溢出的答案给出了一些关于如何处理类不平衡的其他想法,例如欠采样和过采样。在</p>