我正在尝试从熊猫数据帧制作一个训练和测试集。当我跑步时:
sss = StratifiedShuffleSplit(df['event'], n_iter=3, test_size=0.2)
我得到了一个错误:
ValueError: The least populated class in y has only 1 member, which is too few. The minimum number of labels for any class cannot be less than 2.
但是情况并非如此,因为当我运行时:
^{pr2}$我得到:
irrelevant 5030
event 394
你知道是什么引起这个问题吗?在
正如您在对问题的评论中所提到的,是空行/空行导致了错误。在
df['event'].value_counts()
没有显示空行的原因是^{dropna=True
;此参数默认忽略所有null/NaN/np.nan
/None
值。下面是一个简单的例子:在
6
行的输出中,您可以看到NaN
作为另一个类出现,尽管在默认情况下(输出到5
)它不在那里。如果您将这个可选参数作为False
传入,那么您将提前获取空行。在我希望这有意义!在
相关问题 更多 >
编程相关推荐